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Neue Marker fiir die Diagnose und Therapie von Tumoren 



Die vorliegende Erfindung betrifft den Einsatz neuer Marker fur 
die Diagnose bzw. Therapie von Tumorerkrankungen, vorzugsweise 
CTCL. 

Kutane T-Zell-Lymphome (CTCL) stellen eine heterogene Gruppe von 
Erkrankungen dar, bei denen CD4-T-Zellen als der maligne Zelltyp 
vorherrschen. In den meisten Fallen wird der mono- oder 
zumindest oligoklonale Ursprung der malignen Zellen anhand T- 
Zellrezeptor-Rearrangements dokumentiert . Neben verschiedenen 
weiteren Untertypen stellen Mycosis fungoides und das Sezary- 
Syndrom (SS) die haufigsten Formen von CTCL dar. Bei beiden 
Erkrankungen handelt es sich um monoklonale T-Helf er-Memory- 
Lymphome, die durch kutane Plaques, Tumore oder Erythrodermie 
gekennzeichnet sind, wobei SS zusatzlich durch eine 
generalisierte Lymphadenopathie und die Gegenwart von 
neoplastischen T-Zellen im peripheren Blut charakterisiert ist. 

Zu den therapeutischen Ansatzen zahlen die Stadium-abhangige 
Auswahl von PUVA (Psoralen und UV-A) , Retinoiden, Interferon cc- 
2a in Korabination mit Acitretin oder PUVA, verschiedene 
Iramunmodulatoren, Elektronenbestrahlung oder extrakorporale 
Photopherese. Diese Verfahren sind in friihen Krankheitstadien 
erfolgreich, nicht jedoch bei den aggressiven spateren Stadien. 
Z\i moglicherweise sinnvollen zuktinftigen Therapien fur CTCL 
zahlen immunologische Therapien, z.B. Vakzinierung mit Peptiden 
oder Peptid-beladenen dendritischen Zellen so wie dies bereits 
auch zur Behandlung von Mel an omen verwendet wurde. 

Die Gegenwart und Aktivitat von CD8 + -Zellen bei CTCL wurde mit 
der Prognose korreliert. Es konnte gezeigt werden, daS CD8 + - 
reaktive Infiltrate CTCL-spezif isch und lytisch sind. Somit 
mogen zwar Immun therapien ein vielversprechendes Konzept zur 
Behandlung CTCL dar stellen, eine Voraussetzung fur eine solche 
Strategie ist allerdings die Identif izierung Tumor- spez if ischer 
Antigene. In diesem Zusammenhang wurde der T-Zellrezeptor selbst 
als ein Antigen vorgeschlagen (ahnlich den Idiotyp- 
Immunglobulinen als Ziel fiir B-Zell-spezif ische T-Zellen) - In 
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beiden Fallen ist man jedoch mit dem Nachteil konf rontiert , daS 
der Antigen-T-Zellrezeptor fur jeden einzelnen Patienten 
identif iziert werden mufite. ZusammengefaEt mufi allerdings 
festgestellt werden, dafi fur Tumorarten wie CTCL zur Zeit keine 
tumorassoziierten Antigene bekannt sind, somit die Moglichkeiten 
der spezifischen Diagnose bzw. Therapie stark eingeschrankt 
sind. 

Somit liegt der vorliegenden Erfindung im wesentlichen das 
technische Problem zugrunde, Marker (Gene bzw. der en Produkte) 
zu identif izieren und bereitzustellen, die mit Tumoren, 
insbesondere CTCL, in Zusammenhang stehen und gegebenenf alls von 
diagnostischem und/oder . im Rahmen einer Vakzinierungs therapie 
von therapeutischem Nutzen sind. 

Die Losung dieses technischen Problems wurde durch die 
Bereitstellung der in den Patentanspruchen . gekennzeichneten 
Ausfiihrungsf ormen erzielt. 

Es wurden uberraschenderweise eine Reihe von Genen gefunden, 
deren Expression mit CTCL korreliert ist. In den zu der 
vorliegenden Erfindung fuhrenden Experimenten wurden CTCL- 
spezifische Antigene durch Screenen einer Testis- cDNA-Bank bzw. 
einer cDNA-Bank, die aus Tumor-RNA verschiedener kutaner 
Lymphome hergestellt worden war, mit Seren von Tumorpatienten 
identif iziert . Etwa 3 x 10 6 Rekombinante wurden mit Seren von 
Patienten mit Sezary- Syndrom bzw. Mycosis fungoides gescreent. 
Die Ergebnisse zeigen, dafi Tumor- Antigene von CTCL-Tumoren mit 
von Tumorpatienten stammenden Antikorpern identif iziert werden 
konnen. Es konnten positive Klone identif iziert werden, die zu 
19 unterschiedlichen Genen/ORFs gehorten, wozu auch fiinf bisher 
nicht bekannte Sequenzen zahlen. Alle gefundenen Tumor-Antigene 
sind spezifisch, d.h. dafi nur Tumorpatienten, jedoch keine 
gesunden Personen gegen diese gerichtete Antikorper bilden, 
obwohl 13 von diesen Tumor- An tigenen in raindestens 21% der 
getesteten Kontrollgewebe exprimiert werden. Es wurde aufierdem 
ein tumorspezif isches Antigen gefunden, das nur in Testis und 
Tumorgeweben exprimiert wird. Dabei handelt es sich um se2-l, 
das in einem CTCL-Tumor gefunden wurde. Dieses Gen zeigt 
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Ahnlichkeiten zu SCP-1, ein mit der Mitose in Zusaramenhang 
stehendes Protein. Vier Seren von CTCL-Patienten reagierten mit 
verschiedenen SCP-1 -ahnlichen Klonen. Somit konnten mittels den 
zur der vorliegenden Erfindung fiihrenden Experimenten zum ersten 
Mai CTCL-assoziierte Antigene (unabhangig vom T-Zellrezeptor ) 
identif iziert werden, die somit wertvolle Tumormarker 
darstellen. Die Identif izierimg solcher Antigene ist von 
Interesse, da die kodierten Proteine und von diesen abgeleitete 
Peptide als Zielstrukturen, z.B. fur zytotoxische Zellen, dienen 
und als Antigene zur Produktion von diagnostischen oder 
therapeutischen Antikorpern verwendet werden konnen . Zur 
Tumortherapie konnen die von den erf indungsgema&en Nukleinsauren 
kodierten Peptide bzw. Fragmente davon entweder direkt 
appliziert werden oder auf Antigen-prasentierende Zellen geladen 
werden, Auch konnen die Antigene darstellenden Peptide mit Hilfe 
von Vektoren in verschiedenen Zellen (z. B . Dendritischen Zellen 
als Antigen-prasentierende Zellen) exprimiert werden. Weiter 
bilden die identif iziert en Nukleinsauren die Grundlage zur 
Entwicklung diagnostischer Tests, urn zukiinftig eine zuver- 
lassigere und fruhzeitige Diagnose bei Betroffenen zu 
gewahrleisten. Dariiber hinaus werden funktionelle Analysen der 
Proteine zweifellos zum Verstandnis der Tumor entwicklung 
beitragen. Die erf indungsgemafien Nukleinsauren sind somit als 
Kandidatengene fur Untersuchungen der Pathomechanismen anzu- 
sehen, die verschiedenen Tumor erkrankungen, wie z.B. CTCL, 
zugrunde 1 i egen . 

Gegenstand der vorliegenden Erfindung ist somit eine 
diagnostische Zus ammens e t zung , die mindestens eine 
Nukleinsauresequenz enthalt, deren veranderte Expression mit 
einer Tumor -Erkr ankung assoziiert ist, wobei die 
Nukleinsauresequenz se2-5 (Fig.l), se20-10 (Fig. 2), se57-l 
(Fig. 3), se70-2 (Fig. 4), Lgl-2 (Fig. 5), sel-1 (Fig. 6), se2-l 
(Fig. 7), se2-2 (Fig. 8), sel4-3 (Fig. 9), se20-4 (Fig. 10), se20-7 
(Fig. 11), se20-9 (Fig. 12), se33-l (Fig. 13), se37-2 (Fig. 14), 
se89-l (Fig. 15), L14-2 (Fig. 16), L15-7 (Fig. 17), Li9-1 (Fig. 18), 
Li9-4 (Fig. 19), Lii5-2 (Fig. 20), LiilO-6 (Fig. 21), Liii4-5 
(Fig. 22) oder GBP-TA (Fig. 23) umfaJSt. 
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Gegenstand der vorliegenden Erfindung ist ferner ein 
Arzneimittel , das eine Nukleinsauresequenz enthalt, deren 
veranderte Expression mit einer Tumor-Erkrankung assoziiert ist, 
wobei die Nukleinsauresequenz se20-10 (Fig. 2), se57-l (Fig. 3), 
Lgl-2 (Fig. 5) , sel-1 (Fig. 6), se2-l (Fig. 7), se2-2 (Fig. 8), 
sel4-3 (Fig. 9), se20-4 (Fig. 10) , se20-7 (Fig. 11), se20-9 
(Fig. 12), se33-l (Fig, 13 ) , se37-2 (Fig. 14)/ L14-2 (Fig. 16), L15- 
7 (Fig. 17), Li9-1 (Fig. 18) , Li9-4 (Fig. 19), Lii5-2 (Fig. 20), 
LiilO-6 (Fig. 21), Liii4-5 (Fig. 22) oder GBP-TA (Fig. 23) 
umfafit. 

Die vorliegende Erfindung betrifft ferner eine vorstehend 
definierte diagnostische Zusammensetzung oder ein Arzneimittel, 
wobei die Nukleinsauresequenz, deren veranderte Expression mit 
einer malign en Tumor-Erkrankung in Zusammenhang steht, eine 
Nukleinsauresequenz umfaSt, 

(a) die sich von einer vorstehenden, in den Figuren 1 bis 23 
dargestellten Nukleinsauresequenz in der Codonsequenz aufgrund 
der Degeneration des genetischen Codes unterscheidet ; 

(b) die mit einer Nukleinsauresequenz nach einer der Figuren 1 
bis 23 oder nach (a) hybridisiert ; oder 

(c) die ein Fragment, eine allelische Variante oder eine andere 
Variante einer der vorstehend definierten Nukleinsauresequenz 
ist. ■ 

Der Begriff "hybridisierende Nukleinsauresequenz" weist auf eine 
Nukleinsauresequenz hin, die unter ublichen Bedingungen, 
insbesondere bei 2 0°C unter dem Schmelzpunkt der Nukleinsaure, 
mit einer in den Figuren gezeigten Nukleinsauresequenz 
hybridisiert. Der in vorliegenden Erfindung verwendete Begriff 
u hybr i di s i er en " bezieht sich au f konven t i one 1 1 e 
Hybridisierungsbedingungen, vorzugsweise auf 
Hybridisierungsbedingungen, bei denen als Losung 5xSSPE, 1% SDS, 
lxDenhardts-Losung verwendet wird und/oder die 
Hybridisierungstemperatur zwischen 50°C und 70°C, vorzugsweise 
bei 65°C liegen. Nach der Hybridisierung wird vorzugsweise zuerst 
mit 2xSSC, 1% SDS und danach mit 0 , 2xSSC bei Tempera turen 
zwischen 50°C und 70°C, vorzugsweise bei 65°C gewaschen (zur 
Definition von SSPE,SSC und Denhardts- Losung siehe Sambrook et 
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al. # Molecular Cloning: A Laboratory Manual, 2. Ausgabe, Cold 
Spring Harbor Laboratory Press, Cold Spring Harbor NY (1989)). 
Besonders bevorzugt sind stringente Hybridisierungsbedingungen, 
wie sie beispielsweise in Sambrook et al . , supra, beschrieben 
sind. 

Die in der vorliegenden Erfindung verwendeten Begriffe "andere 
Variante" oder "Fragment" umfassen Nukleinsaureseguenzen, die 
sich gegenuber den in den Figuren angegebenen Sequenzen oder 
vorstehenden hybridisierenden Sequenzen durch Deletion (en) , 
Insertion ( en) , Austausch(e) und/oder andere im Stand der Technik 
bekannte Modif ikationen unterscheiden bzw. ein Fragment der 
ursprunglichen Nukleinsauresequenz umfassen, wobei das durch 
diese Nukleinsauresequenzen kodierte Protein noch eine oder 
mehrere der vorstehend bzw. in den Beispielen beschriebenen 
Eigenschaf ten aufweist. Dazu zahlen auch Allelvarianten. Die 
Varianten weisen eine Homologie zu den beanspruchten Sequenzen 
von mind. 7 0%, von mindestens 80%, bevorzugt mindestens 90%, 
ganz bevorzugt mindestens 95%, 96%, 97%, 98% oder 99% auf. 
Verfahren zur Erzeugung der vorstehenden Anderungen in der 
Nukleinsauresequenz sind dem Fachmann bekannt und in 
Standardwerken der Molekularbiologie beschrieben, beispielsweise 
in Sambrook et al . , supra. Der Fachmann ist auch in der Lage, zu 
bestimmen, ob ein von einer so veranderten Nukleinsauresequenz 
kodiertes Protein noch \iber die gewunschten biologischen 
Eigenschaf ten verfiigt. Vor allem in Zusammenhang mit 
diagnostischen Anwendungen bzw. Zusammensetzungen, in denen eine 
der vorstehenden Nukleinsauresequenzen verwendet wird, bezieht 
sich der Begriff "Fragment" auf ein Fragment, das eine Lange von 
mindestens 12, vorzugsweise mindestens 20 und noch mehr 
bevorzugt mindestens 25 Nukleotiden aufweist. 

In einer bevorzugten Ausf uhrungsf orm ist das vorstehend 
definierte Nukleinsauremolekul eine cDNA. 

In einer weiteren bevorzugten Ausf uhrungsf orm ist die 
Nukleinsaurersequenz eine genomische DNA, die vorzugsweise von 
einem Sauger, beispielsweise einem Menschen stammt. Auf Nuklein- 
saurehybridisierung basierende Screening -Verfahren erlauben die 
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Isolierung' der erf indungsgemaEen genomischen DNA-Molekiile aus 
jedem Organismus bzw. abgeleiteten genomischen DNA-Banken, wobei 
Sonden verwendet werden, die die in den Figuren angegebene 
Nukleinsauresequenz oder ein Fragment davon enthalten. 

Die Nukleinsauresequenzen konnen auch in einen Vektor bzw, Ex- 
pressionsvektor inseriert werden. Beispiele solcher Vektoren 
sind dem Fachmann bekannt. Im Falle eines Express ions vektor s fur 
E. coli sind dies z. B. pGEMEX, pUC-Derivate (z.B. pUC8) , 
pBR322, pBlueScript, pGEX-2T, pET3b und pQE-8 . Fur die 
Expression in Hefe sind z.B. pYlOO und Ycpadl zu nennen, wahrend 
fur die Expression in tierischen Zellen z.B. pKCR, pEFBOS, cDM8 
und pCEV4, anzugeben sind. Fur die Expression in speziell 
Insektenzellen eignet sich besonders der Baculovirus- 
Expressionsvektor pAcSGHisNT-A. In einer bevorzugten 
Aus fiihrungs form ist die Nukleinsauresequenz im Vektor mit 
regulatorischen Elementen funktionell verknupft, die dessen 
Expression in prokaryotischen oder eukaryotischen Wirtszellen 
erlauben. Solche Vektoren enthalten neben den regulatorischen 
Elementen, beispielsweise einem Promotor, typischerweise einen 
Replikationsursprung und spezifische Gene, die die phanotypische 
Selektion einer trans formier ten Wirtszelle erlauben. Zu den 
regulatorischen Elementen fur die Expression in Prokaryonten, 
beispielsweise E.coli, zahlen der lac-, trp-Promotor oder T7- 
Prpmotor, und fur die Expression in Eukaryonten der AOX1- oder 
GALl -Promotor in Hefe, und der CMV- , SV40-, RVS-4 0 -Promotor , 
CMV- oder S V4 0 - Enhanc e r fur die Expression in tierischen Zellen. 
Weitere Beispiele fur geeignete Promotoren sind der 
Metallothionein I- und der Polyhedrin- Promotor . 

Zu geeigneten Vektoren zahlen insbesondere auch auf T7 
basierende Expressionsvektoren ftir die Expression in Bakterien 

(Rosenberg et al., Gene 56.(1987), 125) oder pMSXND fur die 
Expression in Saugerzellen (Lee und Nathans, J.Biol . Chem. 263 

(1988) ,3521) . 

Allgemeine auf dem Fachgebiet bekannte Verfahren konnen zur 
Konstruktion von Vektoren oder Plasmiden, die die vorstehenden 
Nukleinsauresequenzen und geeignete Kont rol 1 sequenz en enthalten, 
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verwendet werden. Zu diesen Verfahren zahlen beispielsweise in 
vitro-Rekombinationstechniken, synthetische Verfahren, sowie in 
vivo-Rekombinationsverf ahren, wie sie beispielsweise in Sambrook 
et al., supra, beschrieben sind. 

Wirtsorganismen kSnnen mit den vorstehend beschriebenen Vektoren 
transf ormiert werden, Zu diesen Trans formant en zahlen Bakterien, 
Hefe, Insekten- und weitere Tierzellen, vorzugsweise 
Sauger zellen. Bevorzugt sind die E. coli Stamme HB101, DHl, 
xl77 6, JM101, JM109, BL21, XLlBlue und SG 13 009, der Hefestamm 
Saccharomyces cerevisiae und die tierischen Zellen L, 3T3 , FM3A, 
CHO, COS, Vero, HeLa sowie die Insektenzellen sf 9 . Verfahren zur 
Transformation dieser Wirtszellen, zur ph&notypischen Selektion 
von Transf ormant en und zur Expression der vorstehenden 
Nukleinsauresequenzen unter Verwendung der vorstehend 
beschriebenen Vektoren sind auf dem Fachgebiet bekannt. 

Die vorstehend erwahnten Nukleinsauren eignen sich besonders als 
Antigen-kodierende Struktur fur therapeutische Zwecke. Ziel soil 
es dabei sein, das Immunsystem zu stimulieren, Tumorzellen zu 
eliminieren, die uber eine Nukleinsaure identif iziert werden. 
Dabei gibt es verschiedene Wege, z. B. Injektion der nackten DNA 
in den Patienten. Hierzu wird ein Plasmid mit einem sehr aktiven 
Promotor und mindestens einer erf indungsgemafien Nukleinsaure, 
die insbesondere se20-10, se57-l, Lgl-2, sel-1, se2-l, se2-2, 
sel4-3, se20-7, se20-9, se33-l, se37-2, L14-2 , L15-7, Li9-1, 
Li9-4, Lii5-2, LiilO-6, Liii4-5 oder GBP-TA umfaJSt, 
beispielsweise in den Muskel oder intradermal inj iziert. 

Desweiteren kann die Nukleinsauresequenz nicht nur zu Zwecken 
der rekombinanten Herstellung in einen Vektor inseriert sein, 
sondern auch urn die DNA mit Hilfe von Vektoren in Patienten zu 
injizieren, wo diese ein Antigen fur therapeutische Zwecke 
kodiert. Das Ziel ist, daS die Zellen das Plasmid aufnehmen, 
Antigene produzieren, uber HLA-Molekule einzelne Peptide 
prasentieren und somit eine zytotoxische T-Zell-Immunantwort 
hervorrufen. Diese soil dann zur Abwehr von Tumorzellen fiihren. 
Allgemein ist diese Verf ahrensweise in Conry et al . , Clinical 
Cancer Research 4, S. 2903-2912 (1998) beschrieben. Einen 
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alternativen Weg stellt die "Gene -Gun" -Me thode dar, die in Fynan 
et al., Proc. Natl. Acad. Sci . USA 90., S. 11478-11482 (1993) 
beschreiben ist. Hierbei wird die Nukleinsaure mit Hilfe eines 
Vektors in vivo Antigen-prasentierende Zellen (APCs) , z.B. 
Dendritische Zellen, zur HLA-Prasentation des kodierten Proteins 
gebracht. Dabei kann der die erf indungsgemaSe Nukleinsaure 
enthaltende Vektor tiber verschiedene Wege injiziert' werden : 

a) Lipid- bzw. Liposomen-verpackte DNA oder RNA, z.B. 
allgemein beschrieben' von Nabel et al . , Proc. Natl. Acad. 

^Sci. USA 93, S. 15388-15393 (1996). 

b) Mit einem Bakterium als Transportvehikel fur den 
Expressionsvektor . Geeignete Bakterien sind beispielsweise 
(attenuierte) Listerien [z.B. Listeria monocytogenes], 
Salmonellen-Stamme [z.B. Salmonella spp.]. Allgemein ist 
diese Technik von Medina et al . , Eur. J. Immunol. .29, S. 
693-699 (1999) sowie Guzman et al. , Eur. J. Immunol . 28, S. 
1807-1814 (1998) beschrieben worden. Desweiteren wird auf 
WO 96/14087; Weiskirch et al., Immunological Reviews 158, 
S. 159-169 (1997) und US-A-5, 830, 702 verwiesen. 

c) Mittels Gene-Gun (Williams et al . , Proc. Natl. Acad. 
Sci. USA 88/ S. 2726-2730, 1991). 

In einer bevorzugten Ausfuhrungsf orm ist der die vorstehenden 
Nukl einsaur es equenz en enthaltene Vektor ein Virus, 
beispielsweise ein Adenovirus, Vaccinia-Virus oder ein AAV- 
Virus, der bei einer Gentherapie von Nutzen ist. Besonders 
bevorzugt sind Retroviren. Beispiele fur geeignete Retroviren 
sind MoMuLV, HaMuSV, MuMTV, RSV oder GaLV. Weiter eignen sich 
vorgenannte Viren sowie Fowlpox-Virus , Canarypox-Virus , 
Influenza-Virus oder Sindbis-Virus auch als Basis einer Vakzine. 
Solche neuen Vakzine, die nach Verabreichung an den Patienten 
ant i -Tumor- Iramxini tat verleihen, sind beispielsweise bei N. 
Restifo, Current Opinion in Immunology j$, S. 658-663 (1996) oder 
Ying et al . , Nature Medicine 5(7) , S. 823 ff., (1999) 
beschrieben. Fur Zwecke der Gentherapie konnen die vorstehenden 
Nukleinsauresequenzen auch in Form von kolloidalen Dispersionen 
zu den Zielzellen transportiert werden. Dazu zahlen beispiels- 
weise Liposomen oder Lipoplexe (Mannino et al . , Biotechniques 6. 
(1988), 682). 
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Weiter ist ' es bevorzugt, um eine Tumor- Immuni tat zu erzeugen, 
eine vorstehende Nukleinsauresequenz in Antigen-prasentierende 
Zellen zu trans fizier en und diese dem Patienten zu injizieren. 
Hierbei wird ein Plasmid in vitro in eine Antigen-prasentierende 
Zelle (APCs) , z.B. Dendritische Zellen, gegeben, die dann 
Antigene produzieren und liber HLA-Molekiile einzelne Peptide 
prasentieren. Dabei kann die Plasmid-DNA liber verschiedene Wege 
in die Antigen-prasentierenden Zellen gebracht werden: 

(a) als nackte DNA, z.B. mittels "Gene Gun" Oder 
Elektroporation; 

(b) als Lipid- oder Liposomen-verpackte DNA oder KNA (Nair 
et al., Nature Biotechnology 16, S. 364 ff. (1998)); 

(c) mit einem Virus als Vektor (Kim et al.,. J. of 
Immunotherapy 20M[4JLr_ S. 276-286 (1997)); 

(d) mit einem Bakterium als Transportvehikel fur den 
Expressibnsvektor (Medina et al . , Eur. J. Immunol. 29., S. 
693-699 (1999); Guzman et al., Eur. J. Immunol. J28., S. 
1807-1814 (1998) ) 

Es kann auch das von einer vorstehenden Nukleinsaure kodierte 
Protein, das im Zusammenhang mit dem Vorhandensein einer 
malignen Tumorerkrankung steht, hergestellt werden. Das dazu 
bevorzugt angewendete Verfahren umfaSt die Kultivierung der 
vorstehend beschriebenen Wirts zellen unter Bedingungen, die die 
Expression des Proteins erlauben (vorzugsweise stabile 
Expression), und Gewinnung .des Proteins aus der Kultur. 
Geeignete Verfahren zur rekombinanten Herstellung des Proteins 
sind allgemein bekannt (siehe beispielsweise Holmgren, 
Annu . Rev. Biochem. 54 (1985), 237 ; LaVallie et al . , 
Bio /Technology 11 (1993), 187; Wong, Curr.Opin. Biotech. 6 (1995), 
517; Romanes, Curr .Op in. Biotech. 6. (1995), 527; Williams et al. , 
Curr. Opin. Biotech. (1995) , 53 8; und Davies, Curr. Opin. Bio- 
tech. 6 (1995), 543. Auch geeignete Reinigungsverf ahren 
(beispielsweise praparative Chromatographie, 
Af fini tats chroma tographie , beispielsweise Immunoaf f ini- 
tatschromatographie, HPLC etc.) sind allgemein bekannt. In 
diesem Zusammenhang soil erwahnt werden, daS das vorstehend 
erwahnte Protein gemaS ublicher, auf dem Fachgebiet bekannten, 
Verfahren modifiziert sein kann. Zu diesen Modif ikationen zahlen 
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Austausche ; Insertionen oder Deletionen von Amino saur en , die die 
Struktur des Proteins modif izieren, wobei seine biologische 
Aktivitat im wesentlichen erhalten bleibt. Zu den Austauschen 
zahlen vorzugsweise "konservative" Austausche von Aminosaure- 
resten, d.h. Austausche gegen biologisch ahnliche Reste, z.B. 
die Substitution eines hydrophoben Rests (z.B. Isoleucin, Valin, 
Leucin, Methionin) gegen einen anderen hydrophoben Rest, oder 
die Substitution eines polaren Rests gegen einen anderen polaren 
Rest (z.B. Arginin gegen Lysin, Glutaminsaure gegen 
Asparaginsaure etc . ) . Deletionen konnen zur Erzeugung von 
Molekiilen fiihren, die eine deutlich geringere GroSe aufweisen, 
d.h., denen beispielsweise Aminosauren am N- oder C-Terminus 
fehlen. 

Fur die gewunschte Anti-Tumor-Vakzinierung eignen sich auch 
Injektionen mindestens eines der Proteins oder eines oder 
mehrerer davon abgeleiteter Peptide. Aus der Sequenz des 
erfindungsgemaBen Proteins werden dafur entweder mitt els 
entsprechender Computerprogramme oder mittels Experimente (z.B. 
phagozytotische Aufnahme des Gesamt-Proteins, danach Analyse der 
prasentierenden Peptide) HLA-abhangige Pep t id-Fragment e 
ermittelt. Diese werden mittels dem Fachmann bekannter Methoden 
kunstlich hergestellt und dann (ggf. mit Immunsystem 
stimulierenden Faktoren, z.B. Interf eronen, Interleukinen usw. ) 
dem Patienten injiziert. Das hinter dieser Behandlung steckende 
Ziel ist, da£ die APCs die Peptide aufnehmen, sie prasentieren 
und so in vivo die Produktipn von Tumor-spezi f ischen 
zytotoxischen T-Zellen stimulieren. Allgemein ist dieses Prinzip 
von Melief et al., Current Opinion in Immunology 8, S. 651-657 
(1996) beschrieben worden. 

Ebenso wie vorstehend beschrieben, konnen anstelle des Vektors 
auch das vorstehende Protein bzw. Fragmente davon in vitro auf 
APCs geladen werden. Die beladenen Zellen werden dann dem 
Patienten z.B. in die Lymphknoten injiziert und sorgen direkt 
fur die Stimulierung und Vermehrung von Tumor- spez if ischen 
zytotoxischen T-Zellen (Nestle et al . , Nature Medicine 4(3) , S. 
328 ff. (1998); Schadendorf et al., in: Burg, Dummer, Strategies 
for immunointerventions in Dermatology, Springer Verlag, Berlin 
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Heidelberg, - S. 399-409, 1997) Fur die Vakzinierung kann es 
vorteilhaft sein, gegenuber dem Wildtyp-Antigen einzelne 
Aminosauren, wie vorstehend beschrieben, zu modif izieren, da 
damit u.U. eine Erhohung der Bindung und eine Verbesserung der 
Wirksamkeit zu erreichen ist (Clay et al., The Journal of 
immunology 162 , S. 1749-1755, 1999). 

Besonders bevorzugt fur die vorstehenden therapeutischen 
Mafinahmen ist mindestens eine Nukleinsauresecjuenz, die die 
Nukleinsauresequenz se20-10 (Fig. 2), se57-l (Fig. 3), Lgl-2 
(Fig. 5), sel-1 (Fig. 6), se2-l (Fig. 7), se2-2 (Fig. 8), sel4-3 
(Fig. 9), se20-7 (Fig. 11), se20-9 (Fig. 12), se33-l (Fig. 13), 
se37-2 (Fig. 14), L14-2 (Fig. 16), L15-7 (Fig. 17), Li9-1 (Fig. 18), 
Li9-4 (Fig. 19), Lii5-2 (Fig. 20), LiilO-6 (Fig. 21), Liii4-5 
(Fig. 22) oder GBP-TA umfafit bzw. ein davon kodiertes Protein 
oder ein Fragment davon. 

Die vorliegende Erfindung betrifft auch Antikorper, die die 
vorstehend beschriebenen Proteine (Tumor-Antigene) spezifisch 
erkennen. Die Antikorper konnen monoklonale, polyklonale oder 
synthetische Antikorper sein oder Fragmente davon, beispiels- 
weise Fab-, Fv-oder scFv-Fragmente . Vorzugsweise handelt es sich 
dabei urn monoklonale Antikorper. Fur die Herstellung ist es 
guns tig, Tiere, insbesondere Kaninchen oder Huhner fur einen 
polyklonalen und Mause fur einen monoklonalen Antikorper, mit 
einem vorstehenden (Fusions) protein oder Fragment (en) davon zu 
immunisieren. Weitere "Booster" der Tiere konnen mit dem 
gleichen (Fusions ) protein oder Fragmenten davon erfolgen. Der 
polyklonale Antikorper kann dann aus dem Serum bzw. Eigelb der 
Tiere erhalten werden. Die erf indungsgemafien Antikorper konnen 
gema£ Standardverf ahren hergestellt werden, wobei das von den 
vorstehend erwahnten Nukl e ins aur es eguenz en kodierte Protein oder 
ein synthetisches Fragment davon als Immunogen dienen. 
Monoklonale Antikorper konnen beispielsweise durch das von 
Kohler und Milstein (Nature 256 (1975), 495) und Galfre (Meth. 
Enzymol. 73 (1981), 3) beschriebene Verfahren hergestellt 
werden, wobei Maus-Myelomzellen mit von immunisierten Saugern 
stammenden Milzzellen fusioniert werden. Diese Antikorper konnen 
beispielsweise zur Immunprazipi tation der vorstehend 
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diskutierten Proteine Oder zur Isolierung verwandter Proteine 
aus cDNA- Express ionsbanken verwendet werden. Die Antikorper 
konnen beispielsweise in Immunoassays in Fliissigphase oder an 
einen festen Trager gebunden werden. Dabei konnen die Antikorper 
auf verschiedene Art und Weise markiert sein. Geeignete Marker 
und Markiemngsverf ahren sind dem Fachgebiet bekannt. Beispiele 
fur Immunassays sind ELISA und RIA. 

Weiter konnen die Antikorper neben ihrer diagnostischen Eignung 
auch therapeutisch eingesetzt. werden. Dabei dient z.B. ein von 
den vorstehenden Nukleinsauresequenzen kodiertes Protein als 
Target fur bispezif ische Antikorper. Hierzu wird auf Kastenbauer 
et al., Laryngorhinootologie 78(1) . S. 31-35 (1999) und Cao et 
al. f Bioconj . Chem. 9(6) . S. 635-644 (1998) verwiesen. Die 
erf indungsgemSSen Antikorper eignen sich z. B. daftir, urn in 
Tumoren tiberexprimiertes Antigen abzufangen und so das 
Tuiuorwachstum zu hemmen, da es Hinweise darauf gibt, daS in 
manchen Fallen das Vorkommen von Tumor-Ant igenen nicht nur das 
Vorhandensein von malignen Tumoren indikativ anzeigt, sondern 
aktiv das Tumorwachstum fordert. 

Desweiteren kann durch den Einsatz von Antisense-DNA (RNA) bzw. 
Ribozymen eine Inhibierung der Translation der vorstehenden 
Nukleinsauresequenzen, deren Expression in Tumoren erhoht ist, 
erreicht werden und somit ein therapeutischer Ef f ekt spezifisch 
auf diese Nukleinsauresequenzen bzw. Gene ausgeiibt werden. Es 
bilden sich in den entsprechenden Tumorzellen RNA/DNA-Hybride, 
die so die Transkription yerhindern und - im Fall der Antisense- 
RNA - gleichzeitig einen Abbau der Hybride (und somit der RNA) 
durch RNase H bewirken (Scanlon et al . „ The Faseb Journal 9, S. 
1288-1296, 1995) 

Die vorliegende Erfindung betrifft somit ein Arzneimittel oder 
eine diagnostische Zusammensetzung, das (die) die vorstehend be- 
schriebenen Nukleinsauresequenzen, Vektoren, Proteine, 
Antikorper etc. oder Kombinationen davon enthalt, bzw. deren 
Verwendung fur die Diagnose und/oder Therapie. Vorzugsweise 
werden diese zur Diagnose oder Behandlung von malignen 
Tumor erkrankungen, insbesondere CTCL, verwendet. Bevorzugt ist 
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die Bereitstellung eines Vakzinierungsmittels , das wie 
vorstehend beschrieben, entweder auf der Nukleinsauresequenz 
Oder dem Pro t ein/ Pept id basiert . Die diagnos t ische 
Zusammensetzung eignet sich dabei einerseits um eine maligne 
Tumor erkrankung f e s t zus t el 1 en , aber auch urn eine 
Verlauf skontrolle durchzuf iihren, beispielsweise therapie- 
begleitend. 

Die vorstehenden Arzneimittel enthalten gegebenenf alls 
zusatzlich einen pharmazeutisch vertraglichen Trager. Geeignete 
Trager und die Formulierung derartiger Arzneimittel sind dem 
Fachmann bekannt. Zu geeigneten Tragern zahlen beispielsweise 
Phosphat-gepuf f erte Kochsalzlosungen, Wasser , Emulsionen, 
beispielsweise 61 /Wasser-Emulsionen, Netzmittel , sterile 
Losungen etc. Die Verabreichung der Arzneimittel kann oral oder 
parenteral erfolgen. Zu den Verfahren fur die parenterale 
Verabreichung gehoren die topische, intra-arterielle, 
intramuskulare , subkutane , intramedul lare , intrathekale, 
intraventrikulare , intravenose, int raper i toneale oder 
intranasale Verabreichung. Die geeignete Dosierung wird von dem 
behandelnden Arzt bestimmt und hangt von verschiedenen Faktoren 
ab, beispielsweise von dem Alter, dem Geschlecht, dem Gewicht 
des Patient en, dem Stadium der Erkrankung, der Art der 
Verabreichung etc. 

Eine vorstehende Nukleinsauresequenz kann auch als Sonde 
verwendet werden, um DNA-Molekule zu isolieren, die 
beispielsweise von einer anderen Spezies oder einem anderen 
Organismus stammen und ein Protein mit einer ebensolchen 
biologischen Aktivitat kodieren. Vorzugsweise weist dazu die 
Sonde eine Lange von mindestens 20, besonders bevorzugt 
mindestens 25 Basen auf. Geeignete, auf Hybridisierung 
basierende Nachweisverf ahren sind dem Fachmann bekannt, z.B. 
Southern oder Northern Blot. Geeignete Markierungen fur die 
Sonde sind dem Fachmann ebenfalls bekannt und dazu zahlen 
beispielsweise Markierung mit Radioisotopes Biolumineszenz- , 
Chemilumineszenz-, Fluoreszenzmarkern, Metallchelaten, Enzymen 
etc . . 
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Daruber hinaus kann dies auch durch eine PCR (Wiedmann et al . , 
PCR Methods Appl . 3, S. 551-564 (1994); Saiki et al . , Nature 
324 , S. 163-166 (1986)) oder "Ligase chain reaction" (LCR) 

(Taylor et al - , Curr. Opin. Biotechnol . 6, S. 24-29 (1995); 

Rouwendal et al . , Methods Mol. Biol. S. 149-156 (1996)) 
erfolgen, wobei die Primer von der Sequenz in den Figuren 
abgeleitet sind und wobei geeignete Primer (hinsichtlich Lange, 
Komplementaritat zur Matritze, dem zu amplif izierenden Bereich 
etc.) vom Fachmann gemafi ublicher Verfahren entworfen werden 
konnen . 

Au£>erdem betrifft die vorliegende Erfindung ein Verfahren zur 
Diagnose von malignen Tumor erkrankungen, in vitro, wobei die 
vorstehenden Nukleinsauresequenzen oder Fragmente davon als 
Sonde verwendet werden. 

Fur das diagnos t ische Verfahren ist es bevorzugt die 
Nukleinsauren und/oder Proteine in Form eines ELISA-Kits, 
Protein-Chips, Nukleinsaure-Chips oder einer mit DNA, RNA oder 
Protein beladener Membran bereitzustellen. 

Bei oben genanntem Verfahren konnen dem Fachmann bekannte 
Methoden beziiglich der Preparation von DNA oder RNA aus 
biologischen Proben, des Res trikt ions verdaus der DNA, der 
Auftrennung der Res triktionsf ragmente auf nach GroEe 
auf trennenden Gelen, beispielsweise Agarosegelen , der 
Herstellung und Markierung der Sonde und des Nachweises der 
Hybridisierung, beispielsweise uber "Southern-Blot*' oder in-situ 
Hybridisierung, angewandt werden. 

Vorzugsweise handelt es sich bei dies em Diagnose-Verf ahren urn 
ein Verfahren, das die folgenden Schritte umfafit: 

Isolierung von Nukleinsaure aus dem Patienten, 
Durchfiihirung einer LCR oder PCR mit geeigneten Primern oder 
einer Hybridisierungs analyse mit einer oder mehreren 
geeigneten Sonden basierend auf einer Nukleinsauresequenz 
der Figuren, 

Nachweis eines amplif izierten Produkts oder einer Hybri- 
disierung als Indiz auf das Vorliegen (oder 
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Nichtvbrliegung) einer Tumorerkrankung (in Abhangigkeit 
davon, ob die jeweilige Nukleinsauresequenz im Tumor im 
Vergleich zu Kontrollgewebe starker oder schwacher (bzw. 
nicht) exprimiert wird. ) 

Dabei werden Primer verwendet, die eine vorstehend diskutierte 
Nukleinsaursequenz oder geeignete Teilbereiche flankieren* 
Diagnostisch von Bedeutung sind dabei Amplif ikationsprodukte von 
mRNA aus dem fraglichen Gewebe, die sich hinsichtlich des 
Auftretens von Tumor-spezif ischen, insb'esondere CTCL- 
spezif ischen Banden von den Amplif ikationsprodukten von mRNA aus 
gesundem Gewebe unterscheiden. 

In einer alternativen bevorzugten Aus fiihrungs form kann ein 
Verfahren angewendet werden, das folgende Schritte umf aSt : 

- Isolierung von RNA aus dem Patient en, 

- Durchfuhxung einer Northern- Analyse mit einer oder mehreren 
geeigneten Sonden, 

- Vergleich der Konzentration und/oder Lange der 
entsprechenden mRNA der Patientenprobe mit einer mRNA einer 
gesunden Person, wobei eine erhohte bzw. erniedrigte 
Konzentration an mRNA (in Abhangigkeit von dem 
entsprechenden Marker; siehe Tabelle 4) im Vergleich zur 
Kontroll-mRNA aus Normalgewebe indikativ fiir eine 
Tumor erkrankung , insbesondere CTCL ist. 

Bei diesem Verfahren konnen dem Fachmann bekannte Methoden 
bezuglich der Preparation von Gesamt-RNA bzw. poly(A)+RNA aus 
biologischen Proben, der Auftrermung der RNAs auf nach GroSe 
auf trennenden Gel en , beispielsweise denatur ier enden 
Agarosegelen, der Herstellung und Markierung der Sonde und des 
Nachweises uber "Northern-Blot" angewandt werden. 

In einer weiteren alternativen Ausf iihrungsf orm kann eine 
mogliche Tumor -Erkrankung auch durch ein Verfahren 
diagnostiziert werden, das folgende Schritte umfafit: 
Gewinnung einer Zellprobe von dem Patienten, 
Inkontaktbringen der so erhaltenen Zellprobe mit einem oder 
mehreren von den erf indungsgemaSen Nukleinsauresequenzen 

15 - 



0238803A2 I > 



WO 02/38803 




PCTVDE01/04229 



kodierten Proteinen oder . Fragmenten davon als Sonde (n) 
unter Bedingungen, die die Bindung von Antikorpern erlau- 
ben, wobei die Gegenwart von Antikorpern in der Zellprobe 
indikativ fur eine Tumor erkrankung, insbesondere CTCL ist. 

Dieser Nachweis kann ebenfalls unter Anwendung von dem Fachmann 
bekannten Standardtechniken durchgeftihrt werden. Diesem sind 
auch Zellaufschlu£verfahren bekannt, die die Isolierung der 
Antikorper auf eine solche Weise erlauben, daS diese mit dem 
Antigen in Kontakt gebracht werden kann. Der Nachweis des 
gebundenen Antikorpers erfolgt vorzugsweise uber Iraraunassays, 
beispielsweise Western-Blot, ELISA, FACS oder RIA oder 
immunhistochemisclie Verfahren. Vorzugsweise erfolgt dieser tiber 
ELISA oder *Dot blot" . Zur Etablierung eines ELISA konnen die 
vorstehenden Nukleinsaureseguenzen oder Fragmente davon in 
Expressionsplasmide kloniert und die entspr. Proteine 
rekoiabinant hergestellt werden, vorzugsweise als Fusionsproteine 
mit einem "His-Tag", was deren Aufreinigung erleichtert. Die 
Proteine werden dann auf Membranen oder andere geeignete 
Oberflachen aufgetragen, ggf . f ixiert und mit adaquat verdunnten 
Patientenseren inkubiert. Nach den ublichen Waschschritten 
erfolgt dann eine Inkubation mit einem sekundaren markierten 
Antikorper gemaJS Routineverf ahren zum Nachweis der gebundenen 
Patienten-Antikorper . Vorzugsweise werden die Patientenseren mit 
einer Vielzahl von Markerproteinen (Antigenen) inkubiert, da der 
Nachweis des Vorhandenseins (oder Fehlens) verschiedener 
Antikorper besser auf die zugrundeliegende Tumor-Erkrankung 
schlieEen la&t und evtl . auch eine Einteilung nach dem 
Erkrankungs stadium erlaubt. 

Weiter betrifft die vorliegende Erfindung einen Kit zur 
Durchfuhrung der erf indungsgemafien Di agnos ever f ahren, der den 
erf indungsgemafien Antikorper oder ein Fragment davon, ein 
vorstehendes Protein (oder davon abgeleitetes Peptid) , eine 
erf indungsgemaSe Nukleinsauresequenz (als Sonde) oder einen z*B. 
fur PCR oder LCR geeigneten, auf der Sequenz der 
erf indungsgemaSen Nukleinsauresequenzen basierenden Primer (oder 
ein Primerpaar) enthalt, gegebenenf alls in Korabination mit einem 
geeigneten Nachweismittel . 
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Je nach Ausgestaltung des mit dem erf indungsgemaSen Kit 
durchzufuhrenden Diagnoseverf ahrens konnen die in dem Kit 
enthal tenden Verbindungen (Nukleinsauremolektile , Proteine , 
Antikorper oder Fragmente davon) an einem geeigneten Trager 
iinmobilisiert sein, d.h. in Form eines Chips oder auf einer 
Membran gebunden vorliegen. 

Alle vorstehend erwahnten Proteine werden serologisch nur von 
Antikorpern aus Seren von Tumorpatienten, nicht aber von Seren 
aus Kontrollpersonen, erkannt und sind somit serologisch 
tumorspezif isch. Da sich diese Spezifitat nicht auf einen 
Tumortyp beschrankt, eignen sich diese Proteine und Antikorper 
sehr gut, urn uberhaupt eine Unterscheidung zwischen Malignitat 
und "Nicht -Malignitat " zu treffen. Es hat sich dabei als 
vorteilhaft herausgestellt , die Untersuchung mit mehr als einem 
der vorstehend erwahnten Tumormarker, d.h. einer Kombination von 
Tumormarkern, durchzuf lihr en und abhangig davon einen 
therapeutischen Ansatz zu wahlen. Dies bedeutet, dafi auch das 
erf indungsgemaSe Arzneimittel mehr als eine der vorstehend 
erwahnten Nukleinsauren, Proteine oder Antikorper enthalten 
sollte . 

Die Erfindung wird nun weiter anhand der Figuren beschrieben, 
welche zeigen: 

Fig.l: Nukl einsauresequenz von se2-5 und ein davon 
abgeleiteter ORF 

Fig-2: Nukleinsauresequenz von se20-10 und ein davon 
abgeleiteter ORF 

Fig-3: Nukleinsauresequenz von se57-l und ein davon 
abgeleiteter ORF 

Fig. 4: Nukleinsauresequenz von se70-2 und ein davon 
abgeleiteter ORF 

Fig. 5: Nukleinsauresequenz von Lgl-2 und ein davon 
abgeleiteter ORF 
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Fig. 6: Nukleinsauresequenz von sel-1 und ein davon 
abgeleiteter ORF 

Fig. 7: Nukleinsauresequenz von se2-l und ein davon 
abgeleiteter ORF 

Fig. 8: Nukleinsauresequenz von se2-2 und ein davon 
abgeleiteter ORF 

Fig. 9: Nukleinsauresequenz von sel4-3 und ein davon 
abgeleiteter ORF 

Fig. 10: Nukleinsauresequenz von se2 0-4 und ein davon 
abgeleiteter ORF 

Fig. 11: Nukleinsauresequenz von se20-7 und ein davon 
abgleiteter ORF 

Fig. 12: Nukleinsauresequenz von se20-9 und ein davon 
abgeleiteter ORF 

Fig. 13: Nukleinsauresequenz von se33-l und- ein davon 
abgeleiteter ORF 

Fig. 14: Nukleinsauresequenz von se37-2 und ein davon 
abgeleiteter ORF 

Fig. 15: Nukleinsauresequenz von se89-l und ein davon 
abgeleiteter ORF 

Fig. 16: Nukleinsauresequenz von L14-2 und ein davon 
abgeleiteter ORF 

Fig. 17: Nukleinsauresequenz von L15-7 und ein davon 
abgeleiteter ORF 

Fig. 18: Nukleinsauresequenz von Li9-1 und ein davon 
abgeleiteter ORF 
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Fig. 19: Nukleinsaur es equenz von Li9-4 und ein davon 
abgeleiteter ORF 

Fig. 20: Nukleinsauresequenz von Lii5-2 und ein davon 
abgeleiteter ORF 



Nukleinsauresequenz von LiilO-6 und ein davon 
abgeleiteter ORF 

Nukleinsauresequenz von Liii4-5 und ein davon 
abgeleiteter ORF 

Nukleinsauresequenz von GBP-TA und ein davon 
abgeleiteter ORF 

Lokalisation von GBP-TA, GBP-TA^^ und Lgl-2 auf dem 
Chromosom lp22.3. Die verwendeten Primer zur 
Unter scheidung der Splicing-Varianten sind 
eingezeichnet . 

Primerset I: tgt tgt aga tea ctt caa ggt gc (forw.) 

cca tat cca aat tec ctt ggt gtg ag (re.) 
Anneal ing-Temp . 6 3 °C 

Primerset II : aga agg aag aaa etc caa aca cat cc 

(forw. ) 

cca tat cca aat tec ctt ggt gtg ag 
(re.) 

Annealing Temp. 48°C 

Die Erf indung wird nun nachfolgend mit Bezug auf die Beispiele 
beschr ieben . 

Hinsichtlich der verwendeten Methoden wird neben den in Beispiel 
1 angegebenen Verfahren au&erdem auf Sambrook, J, Fritsch, E,F. 
•und Maniatis, T. (Molecular cloning; a laboratory manual; second 
edition; Cold Spring Habor Laboratory Press, 1989) und Current 
Protocols in Molecular Biology (John Wiley and Sons, 1994-1998) 
hingewiesen, wobei die nachfolgend erwahnten Techniken, 
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insbesondere Screenen von cDNA-Bibliotheken, Praparation von DNA 
bzw. RNA, PCR, RT-PCR oder Northern Blot dem Fachmann 
hinreichend bekannt sind und beherrscht werden. 



Beispiel 1: Allgemeine Verf ahren 

(A) Gewebe und Seren 

Seren und Tumorgewebe wurden bei diagnos t ischen oder 
therapeutischen Routineverf ahren rait Einverstandnis der 
Patienten (und der Erlaubnis des zustandigen Ethikkomitees) 
erhalten. Die Lagerung der Gewebe und Seren erfolgte bei -2 0°C 
bzw. -80°C. 

(B) Herstelluna der von cDNA-Banken 

mRNA wurde aus Testis-Proben unter Verwendung eines Kits fur 
RNA-Isolierung( w RNeasy midi kit"; Qiagen, Hilden, Deutschland) 
und danacb eines Kits fur mRNA-Isolierung ( u oligotex mRNA kit" ; 
Qiagen) entsprechend den Empf ehlungen des Herstellers 
extrahiert. Fur die Konstruktion der A,-ZAP-Expressionsbank 
("UNI-ZAP™ XR custom cDNA library"; Stratagene, La Jolla, CA, 
USA) wurden insgesamt 10,4 fig mRNA verwendet. Die c DNA- Bank 
bestand aus 10 6 primaren Rekombinanten mit einer Insertionslange 
tiber 0,4 kbp und wurde zu 10 10 Plaque-bildenden Einheiten (pfu) 
amplif iziert. Fur die Konstruktion der CTCL-Bank wurden 4,8 fig 
mRNA aus verschiedenen Proben von kutanen T- und B-Zell 
Lymphomen verwendet Die Zahl der primaren Rekombinanten betrug 
6 x 10 7 . Das Vorgehen war analog zuiri vorbeschriebenen Vorgehen 
bei der Testis-Bank. 

(C) Immunscreenina 

Das Xramunscreening wurde wie in Sahin et al . (PNAS USA 92. 
(1995), 11810-11813) und Tureci et al . (Cancer Res, 56 (1996), 
4766-4772) beschrieben durchgefubrt . Alle Seren wurden in Tris- 
gepufferter Saline (TBS mit 0,2% Trockenmilchpulver, pH-Wert 
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7,5) verdunnt und mit E . coli-Proteinen (mechanisch aufgebrochen 
Oder durch Phagen ohne Insertion lysiert) vorabsorbiert . Mit 
rekombinanten X-ZAP-Phagen transduzierte E.coli wurden auf NZY- 
Agar bei einer Konzentration von 2000 Plaques / Platte 
ausplattiert und die Expression der rekombinanten Proteine wurde 
mittels Isopropyl-0-D-Thiogalactosid induziert. Die Platten 
wurden bei 37°C ti.N. inkubiert und die Proteine 4 Stunden bei 
37°C auf Nitrozellulose-Membranen transferiert und gebunden. Die 
Membrane wurden mit Tween-20™ (0,05%) enthaltender TBS 
gewaschen, mit 5% Trockenmilchpulver in TBS abgesattigt und mit 
Seren (entweder von Patienten oder als Kontrolle von gesunden 
Personen) bei einer Endkonzentration von 1/100 inkubiert. 
Reaktive Proteine wurden mit einem Alkalische-Phosphatase- 
gekoppelten sekundaren Antikorper (Ziege-anti~human-IgC , Fc- 
Fragment; Dianova, Hamburg, Deutschland) nachgewiesen und 
mittels 5-Brora-4-Chlor-3-Indolylphosphat und Nitroblau- 
Tetrazolium sichtbar gemacht. Positive Pbagemids wurden mittels 
Seren von Patienten mit Mycosis fungoides (n=15) und S^zary 
Syndrom (n=3) sowie gesunden Personen als Kontrolle (n=10) 
weiter untersucht. Positive Phagemids wurden zur Monoklonalitat 
subkloniert und einer in vivo-Exzision des "pBluescript"- 
Plasmids (entsprechend dem Protokoll des Herstellers der 
Genbank, Stratagene, La Jolla, CA, USA) unterzogen. DNA wurde 
entsprechend dem Protokoll des Herstellers isoliert ("QIAprep 
spin miniprep"; Qiagen) . Die Grofie der Insertionen wurde durch 
eine Smal/KpnI-Spaltung und Gelelektrophorese analysiert. Die 
Seguenzierung wurde mittels eines automat ischen Fluoreszenz- 
Sequenziergerats (Modell 377; Perkin-Elmer / Applied Biosystems, 
Forster System, CA, USA) und des Dye-Terminator-Verf ahrens 
entsprechend den Angaben des Herstellers ( M ABI PRISM Big Dye 
Ready Reaction Terminator Cycle Sequencing Kit"; Perkin-Elmer) 
durchgefuhrt . Primer wurden chemisch synthetisiert . Die 
Sequenzen der Klone wurden auf beiden komplementaren Strangen 
vollstandig ermittelt. 



(D) Tumorgewebe und Zellinien 

Von 17 CTCL-Patienten erhaltene Gewebeproben dienten als Quelle 
fur die herstellung von Tumor- cDNA : 13 Mycosis fungoides 
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(Stadium lb bis IVb, hauptsachlich lib) , 2 Sezary Syndrome 
(Stadium III) , 1 T-Zbnen-Lymphom (Stadium IVb) und 1 CD30+ CTCL 
(Stadium lib) . Aufierdem wurden cDNAs von den folgenden 4 CTCLi- 
Zellinien hergestellt: My-La (Mycosis fungoides; Kaltoft et al.., * 
in Vitro Cell Dev. Biol. 28a (1992), 161-167), SeAx (Sezary 
Syndrom; Kaltoft et al . , Arch. Dermatol. Res. 280 (1988), 264- 
267), HH (Lymphomatoide Papulose; ATCC-Nr . : CRL-2105) und HuT-7 8 
(Sezary Syndrom; ATCC-Nr. : TIB-161) . AuEerdem wurde cDNA von 
sechs Leukamie-Zellinien (ARA-10, Jurkat, KG1, K562, Nairn- 2 und 
SKW6.4 und 22 Melanom-Zellinien hergestellt. 

Zur Analyse der Gewebeverteilung - innerhalb normal en Geweben 
wurden ausfiihrlich Kontroll-cDNAs verwendet, dazu zahlten auch 
drei Felder von im Handel erhaltlichen cDNAs (alle von Clontech, 
CA, USA) : humane "multiple tissue"-cDNA Feld I, Feld II und 
humanes fotales MTC-Feld. Zusatzlich wurden verschiedene im 
Handel erhaltliche Gesamt-RNAs zur Herstellung weiterer 
Kontroll-cDNAs mittels des vorstehend beschriebenen Verfahrens 
erzeugt. SchlieSlich dienten auch noch cDNAs von drei 
aktivierten CD8+ T-Zellinien (Moller et al . , British Journal of 
Cancer 77 (1998), 1907-1916) als Kontroll-T-Zellen. 

(E) RT-PCR 

Auf grund der eingeschrankten Menge an RNA wurde bevorzugt RT-PCR 
zur Untersuchung der identif izierten Sequenzen innerhalb 
verschiedener normaler Gewebe und Tumor-Gewebe verwendet. In 
ausgewahlten Fallen wurden diese Untersuchungen mittels 
Northern-Blot-Analysen vervollstandigt .. RT-PCR wurde mittels *MJ 
Research PCT-200 17 (Biozym, Oldendorf, Deutschland) mit einer 
einminiitigen Anlagerung bei variabler Temperatur mit 35 Zyklen 
durchgefiihrt. Alle RT-PCR wurden in mindestens zwei unabhangigen 
Experimenten durchgefiihrt. Die RNA-Isolierung, RT-PCR und die 
Northern-Blot-Analysen wurden ansonsten gemafi iiblicher 
Standardverfahren und Standardbedingungen durchgefiihrt. Die 
Primer sequenzen und Anneal ing-Temperatur en fur die verschiedenen 
Klone sind in der nachf olgenden Tabelle 1 angegeben: 
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Klon 


Forward Primer 


Reverse Primer 


Anneal. 
Temp. 


sel-1 


gca aaa gca att aga ego tag c 


cac age cct gtt ctt ott tag c 


57°C 


se2-l 


gta cag cag aaa gca age aac tga atg 


gga aat tgg att eta aag cag ttc ctt c 


55'C 


se2-2 


ota tga ate caa gae caa agg c 


etc cac ttt ggt cct tgt tag c 


59°C 


se2-5 


acc cac gca gat ttg gaa to 


agg ctg ato act ggc tgt g 


59°C 


sel4-2 


cot tat tgt aca ctg ggg ott c 


cag aca caa gga act gaa gta acg 


60°C 


sel4-3 


cac tgc caa gat aga caa gca g 


get ctt ate cag gaa gtc eat g 


59°C 


se20-4 


tac agg ate tea gae ata tct cca tg 


aaa tgt ott ccc act gca taa tag to 


S9°C 


se20-7 


taa gga aac aat tea gtc aca taa gg 


ctg tag ctt age aat ttg ttct tot g 


59°C 


se20-9 


tta tga ggc tta gaa ttt caa cca c 


aaa ggc ttt caa aac att ttt caa c 


59°C 


8e20-10 


gta gag ate aga gag ttg tga cat ctg 


tat tac ttt tea ctg tta cac tgc tgg 


59°C 


se33-l 


gee aca gag aat gaa cca ctt aac 


gag gga eta tea gtt get gtt tg 


60°C 


se37-2 


gca tct aat aga acg eta eta coa cc 


ctg tga get ate acc tat cct tga g 


60°C 


se574 


gtg aca gtg acc aca gaa att ccc cc 


cac gtt tct cag age tgc tgc tec 


63°C 


se70-2 


get gca cag aaa acc tta ctt gtt tec acc 


etc gta aat gca gaa ato tec aat gec c 


56°C 


se89-l 


tec aca gec tat tgg etc act tgg ac 


gee ctt tag tgt gtc tgt aat tgg aat cag 


57°C 


RAP140 


tec aca gec tat tgg etc act tgg ac 


gca cac act get cct cca cot gae 


57°C 


L14-2 


got got get gtt tac aga aag got cac 


gga aag tta tec aca get act gag gae cc 


64°C 


L15-7 


\c.C\ P.P.I" P.r*£* "f+f flot pfp t^aa o++ non 
IV/ V/ uuv vv<* HI CLAl VLC Coa till CUU CC 


etc ago att tgc cgc cgt aac tt 


62°C 


Li9-1 


paa flfln tfl.c ssa trtft p-atx en a pap 


etc acg aaa tat gag ctt cao oao 


63°C 


Li9-4 


tta cts ate etc tec tec eta erat? ten 


<uc tic tgc xca gtc aga ate cca tgc 


67°C 


Lgl-2 = 
Primer set I 
(GBP-TA) 


t£t tfft apft tea ctt fifti* ^Ort crc 


cca tat cca aat tec ctt ggt gtg ag 


63 °C 


GBP-TA 
Primer set II 


tgt tgt aga tea ctt caa ggt gc 


cca tat cca aat tec ctt ggt gtg ag 


48°C 


Lii5-2 


tga gaa tga ggt ggg ggt gg 


tgg gga acc gga tea gga c 


58°C 


Liil0^6 


gca tec tac cac caa etc gtc c 


agt tct gag acc gtt ctt cca cc 


57°C 


Iiii4-5 


get gcg gae ata aat ctt aaa gc 


agg gtc tea etc tga ttg cc 


56°C 
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(F) Northern Blot 



10 fig Gesamt-RNA werden auf einem MOPS-Gel elektrophoretisch 
aufgetrennt und auf positiv geladene Nylon-Membranen iibertragen. 
Die Sondenmarkierung erfolgt mittels des Roche High Prime Kits 
mit 0C- 32 P-dCTP. Die Entfernung der nicht eingebauten Nukleotide 
erfolgt mittels des Qiagen Removal Kits (Fa, Qiagen, Hilden) . 
Die Prahybridi si erring wird bei 60°C fur 1-2 Stunden durchgef iihrt . 
Die Hybridisierung erfolgt bei 60°C vorzugsweise tiber Nacht. Die 
Prahybridisierungs- und die Hybridisierungs-Losungen haben die 
Zusammensetzung: 10% Dextransulf at, 1% SDS, lOx Denhardts 
Reagenz, 3x SSC. Das nachfolgende Waschen erfolgt ftir 2 x 30 
Minuten mit 2x880/0,1% SDS bei 42°C und dann 2 x 30 Minuten mit 
0,2x880/0,1% SDS bei 65°C. Es wird ein Kodak X-Omat-Film fur eine 
Expositionszeit von 3-10 Tagen aufgelegt. 



Beispiel 2z Screenen nach positiven Klonen 

Ungefahr 1,9 x 10 6 rekombinante Klone einer von normalem Testis- 
Gewebe erhaltehen cDNA-Bank wurden mit Seren von Patienten mit 
kutanen T-Zell-Lymphomen (CTCL) einschlieElich Mycosis fungoides 
(MF) und Sezary Syndrom gescreent. Es konnten 28 Klone, die 22 
verschiedene ORFs bzw. Gene reprasentieren, nachgewiesen werden 
und diese wurden hinsichtlich serologischer Reaktivitat und 
molekularer Verteilung weiter untersucht. Eine sekundare 
Bestatigung wurde durch die Verwendung zusatzlicher Seren von 
Patienten mit einer positiven Diagnose fur Mycosis fungoides 
(MF) (n=15) oder Sezary Syndrom (n=3) und 10 Kontrollseren von 
gesunden Freiwilligen durchgef iihrt . Die Reaktivitat der Seren 
der Patienten war mit den Tumors tadium (hochstens Stadium III) 
assoziiert (Tabelle 2) . Dies war jedoch nicht statistisch 
signifikant (X 2 -Test und Mann-Whitney U-Test) , vermutlich 
aufgrund der niedrigen Anzahl von Seren mit hohen Tumorstadien. 
Die Reaktivitat der Patienten-Seren war im Bereich von 11% bis 
71% von rekombinante Klone identif izierenden Seren. 
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Tabelle 2 : Anzahl positiver Klone in Korrelation mit dem 
Tumorstadium des Serum- Spenders 





Primar-Screen 


Sekundar-Screen 


Tumor- 
Stadium 

des 
Patienten 


Anzahl 
der ein- 
gesetzten 
Seren 


gescreente 
Plaques 
(positiv / 

gesamt) (1) 


Haufigkeit^ 


Anzahl der 
ein- 
gesetzten 
Seren 


Plaques 
(positiv / 
gesamt) 


Haufigkeit 


I 


6 


1 / 524.000 


0,2x1 0 -01 


7 


10/106 


0,09 


n 


6 


15 / 790.000 


l,9xl0- us 


6 


28/84 


0,33 


in 


3 


12/274.000 


4,4x1 0" 05 


3 


19/47 


0,40 


IV 


2 


0/270.000 


0 


2 


11/39 


0,28 


gesamt 1 


17 


28/1.858.000 


l,5xl0-° 5 


18 


68/276 


0,25 



Primar Screen einer Testis cDNA Bank Ayurde nacheinander mit 17 einzelnen Seren 
durchgeftihrt, die von Patienten stammten, die Tumoren im angegebenen Stadium aufwiesen. 
Die Anzahl der positiven und gesamten analysierten Plaques sind in der 3. Spalte angegeben. 
Wahrend des Sekundar Screens wurde jeder positive Plaque (28) mit bis zu 18 individuellen 
Seren verschiedener Patienten im angegebenen Tumorstadium nachgetestet. 
(1) Kumuliert tiber alle getesteten Seren. (2) Positive Klone dividiert durch Gesamtzahl der 
getesteten Klone. 



Die Anzahl und Wahrscheinlichkeit aller serologischen Antworten 
sind hinsichtlich des Tumor stadiums der Patienten 
zusammengefafit, von denen Serum fur das Screenen einer Testis- 
cDNA-Bank genommen wurde. Obwohl die Daten eine hohere 
Wahrscheinlichkeit fur das Vorhandensein von Antikorpern gegen 
Tumor -Anti gene (mit dem Gipfel bei Stadium III) anzeigen, sind 
diese Unterschiede nicht statistisch signifikant. 
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Tabelle 3: Serologische Analysen der identif izierten Klone 



Klon 


CTCL 


Kontrollen 




ICdKLl V 






n 


sel-1 


50% 


10 


0% 


5 


se2-l 


/.ji /o 


18 


0% 


10 


se2-2 


JJ /o 


'a 


0% 


g 


se2-5 




in 


0% 


5 




1 1x0 


o 


0% 


5 


se20-4 




in 


ft°/ 
U/o 


J 


ep*)A_7 

sezu-/ 


i no/ 
JU70 


1 ft 
1U 


fto/, 

U/O 


7 




25% 


o 

o 


no/ 
Uyo 


c 
3 


..in i rv 


11% 


IS 


no/ 
0% 


i n 
1U 


se3J-l 


29% 


17 


AO/ 


IU 


SC37-2 


29% 


17 


0% 


10 _ 


se57-l 


33% 


15 


txo/ 
UVo 




se/0-2 


10% 


10 


f\OZ 
VVO 


o 


..on i 


44% 


18 


0% 


o 


T U O 
Lrl4-2 


42% 


i a 


ftO/ 


c 




33% 


21 


0% 


7 


Li9-1 


19% 


21 


0% 


5 


Li9-4 


57% 


21 


0% 


6 


Lgl-2 


56% 


16 


0% 


9 


LH5-2 


20% . 


15. 


0% 


8 


LiilO-6 


6% 


16 


0% 


8 


Liii4-S 


29% 


17 


0% 


8 



Die Tabelle gibt die prozentuale Reaktivitat der Seren (Anzahl n) 
gegen die getesteten Klone im sekundaren Screen an. 



Der Prozentsatz der reagierenden und die Gesamtzahl der 
getesteten Seren (n) wahrend des sekundaren Screenens sind 
angegeben. Bei den Klonen se2-l und se20-4 ist zusatzlicli 
jeweils einer der homologen Klone angegeben, da diese sich in 
ihrem Reaktionsmuster unterschieden, vermutlich aufgrund von 
Sequenzunterschieden . 
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ie reprasentieren bisher nocli 



Ftinf Antigene reprasentieren bisher nocli nicht bekannte 
Sequenzen (se2-5, se20-10, se57-l, se70-2 und Lgl-2) . Das 
mittels RT-PCR analysierte RNA-Expressionsmuster der 
identif izierten Antigene variierte zwischen hocheingeschrankter 
und ubiquitarer Expression in 2 8 normalen, 17 CTCL -Tumor geweben 
und 33 Tumorzellinien unterschiedlichen Ursprungs (Tabellen 4 
und 5) . 

Tabelle 4: Express ionsanalyse mittels RT-PCR mit Antigen- 
spezif ischen Primern und cDNA von versrfiiedenen Geweben und 

Zell-Linien 



cDNA 


Kontrollen 


Tumor Gewebe 


Zell-Linien 


Primer 
gegen Klon 


multi-tissue 
panels { ' 
(n) 


aktivierte 

/7T»T _ (2) 

CILs 1 
(n=3) 


CTCL 

(n) 


CTCL 
(n=4) 


Leukdmie 
(n=5-6) 


Melanom 
(n) 


sel-1 


100% (17) 


100% 


91% (11) 


100% 


100% 


100% (6) 


se2-l 


4% (28) (U) 


0% 


6% (17) 


0% 


0% 


0% (11) 


se2-2 


100% (18) 


100% 


90% (10) 


100% 


83% 


80% (5) 


se2-5 


94% (18) 


0% 


55% (11) 


0% 


100% 


100% (11) 


sel4-3 


100% (18) 


100% 


100% (11) 


100% 


100% 


100% (11) 


se20-4 


100% (18) 


100% 


92% (12) 


100% 


100% 


100% (11) 


se20-7 


100% (15) 


100% 


100% (11) 


100% 


50% 


80% (5) 


se20-9 


100% (18) 


100% 


82% (11) 


100% 


83% 


45% (11) 


se20-10 


46% (28) p> 


67% 


77% (13) 


100% 


100% 


55% (11) 


se33-l 


61% (28) P) 


100% 


75% (16) 


100% 


83% 


100% (11) 


se37-2 


100% (16) 


100% 


93% (15) 


100% 


83% 


75% (5) 


se57-l 


21% (28) p) 


0% 


6% (17) 


0% 


0% 


0% (23) 


se70-2 


54% (28) P) 


33% 


31% (16) 


100% 


100% 


45% (22) 


se89-l 


87% (23) 


100% 


75% (16) 


100% 


100% 


73% (22) 


L14-2 


75% (24) 


33% 


40% (15) 


50% 


60% 


10% (21) 


LI 5-7 


65% (26) 


100% 


33% (15) 


50% 


40% 


20% (20) 
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Li9-1 


R5% (26) ' ^ 


33% 


80% (15) 


75% 


100% 


42% (12) 


Li9-4 


92% (26) 


100% 


73% (15) 


75% 


80% 


60% (15) 


GBP-TA 


32% (28) (3>4) 


0% 


26% (19) 


75% 


20% 


0% (23) 


Lii5-2 


59% (22) 


0% 


21% (14) 


25% 


75% 


21% (24) 


LiilO-6 


86% (21) 


100% 


100% (14) 


50% 


100% 


nt 


Liii4-5 


55% (22) 


33% 


29% (14) 


100% 


75% 


nt 



Die Tabelle gibt die prozentuale Haufigkeit der Expression in verschiedenen Geweben und Zell-Linien 
nach RT-PCR-Analyse an (Anzahl der Gewebe ist in Klammern; nt: nicht getestet). (1) RT-PCRs an 
Testis cDNA ergab immer positive Ergebnisse. Im Falle von Klonse2-l war Testis cDNA die einzige 
positive Probe. Zusammensetzung der Kontroll-Palette siehe Table 5. (2) Aktivierte 2ytotoxische T- 
Zellen. (3) Details zu diesen Ergebnissen siehe Table 5. (4) GBP-TAshort mit 7%. 



Tabelle 5: RT-PCR-Analysen mittels spezif ischen Primern gegen 
dif ferentiell exprimierte Sequenzen und xx multiple tissue" 

(MTC)-cDNA 



Primer gegen Klon: 


se2-l 


se20-10 


se33-l 


se57-l 


se70-2 


GBP-TA/ 
-TAshort 


Darm 














Diinndarm 




• 4- 


+ 


+ 


+ 


-/+ 


fetale Leber 












-/+ 


fetale Lunge 






+ 




+ 




fetale Milz 












-/+ 


fetale Niere 




+ 


+ 




+ 




fetaler Skelettmuskel 






+ 




+ 




fetaler Thymus 












-/+ 


fetales Gehirn 






\ + 




+ 




fetales Herz 






+ 




+ 


-/+ 


Gehirn 




+ 


+ 








Haut 






+ 








Herz 




+ " 










Knochenmark 






+ 


+ 






Leber 














Lunge 
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Magen 




+ 








+ 


Milz 




+ 


+ 




+ 


-/+ 


Niere 




+ 






+ 




Ovar 




— 


+ 


— 






Pancreas 




*" 


+ 


— 






periph. Blut Lymphozyten 


■* 


"* 


- 


— 


— 


— 


Placenta 




+ 


+ 






-/+ 


Prostata 


- 


+ 


+ 








Skeletmuskel 














Testis 




4- 


t 


4. 
1 






Thymus 






+ 








Trachea 




+ 











paletten hergestellt (Clontech). Jede Probe enthielt cDNA aus Proben mehrerer Individuen. 
Die Haut cDNA wurde aus einer einzelnen Probe hergestellt. RT-PCR gegen GBP-TA / GBP- 
TAshort unterscheidet die beiden Varianten. 

Beispiel 3: Tumorspezif ische Antigene 

Sechs Klone (die durch mindestens vier verschiedene 
Rekoinbinanteii reprasentiert werden) war en zu SCP-1 homolog, 
einem mit der Meiose in Zusammenhang stehenden Protein (Ttireci 
et al., PNAS USA 95. (1998), 5211-5216). • Interessanterweise 
unterschied sich die serologische Reaktivitat verschiedener 
Seren zwischen den unterschiedlichen SCP-l-Klonen: Klon se2-l 
wurde durch Seren von 2/15 MF-Patienten und 2/3 von Patienten 
mit Sezary Syndrom nachgewiesen . Mittels RT-PCR wurde 
nachgewiesen, daS se2-l tumorspezif isch ist. Ein weiterer zu 
SCP-1 homologer Klon (se37-l) wurde durch 3/9 MF-Seren und 1/3 
Sezary Syndrom-Seren nachgewiesen. Dies konnte verschiedene 
Epitope von SCP-1 widerspiegeln, da die Klone sich in ihrer 
Lange unterschieden. Klon se33-2 reagierte auEerdem auch mit 1/5 
Kontrollseren. Interessanterweise kodierte dieser Klon eine 
weitere Peptidsequenz innerhalb des ersten Leserahmens, die 
innerhalb der anderen zu SCP-1 homologen Klone nicht vorhanden 
war und somit ein Autoantigen darstellen konnte/ das fur die 
Reaktivitat des Kontrollserums verantwortlich ist. Die PCR- 
Analysen wurden mit den gleichen Primern wie von Tiireci et al . 
(1998) verof f entlicht durchgefuhrt , die auch zu den SCP-1 
homologen Klonen perfekt paSten. Innerhalb aller getesteten 
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normalen Geweben sowie den Tumorproben und Zellinien konnten nur 
eine Testis-Probe und eine MF-Probe (Patient H.S.) gefunden 
werden, die SCP-1 mRNA exprimierte . Das positive Ergebnis der 
MF-cDNA konnte durch Northern-Blot bestatigt werden, der eine 
Bande von etwa 4,3 kb ergab. Aufierdem reagierte das Serum des 
Patienten H.S. auch mit se2-l und einem der anderen zu SPC-1 
homologen Klone. Desweiteren sind gemafi Northern Blot Analyse 
die Klone se57-l und L15-7 Tumor-spezif isch. 



Beispiel 4: (A) Antigene mit eingeschranktem Expressionsmuster 
und (B) ubicjuitar exprimierte Antigeixe 

Nachf olgend werden 13 Antigene mit dif f erentieller oder 
ubiquitarer Expression (nachgewiesen uber RT-PCR) beschrieben 
(siehe Tabellen 4 und 5). 

(A) 

Fur funf neue Antigene (se2-5, 3620-10, se57-l, se70-2 und Lgl- 
2) und zwei Antigene mit Homologien zu bekannten Genen (se33-l : 
NP220; se89-l: mit Retinoblastom in Zusammenharig stehendes 
Protein RAP140) zeigte sich eine dif f erentielle Expression auf 
molekularer Ebene. Die serologische Reaktivitat gegen diese 
Klone (def iniert als Prozentsatz reaktiver Seren wahrend des 
sekundaren Screenens) betrug im Durchschnitt 31%. Eine geringe 
Reaktivitatsrate zeigte sich gegenuber den Klonen se20-10 und 
se70-2 (2/18 bzw. 1/18 reaktive Seren), wahrend 71% der Seren 
von CTCL-Patienten (n=14) mit dem Klon se89-l positiv 
reagierten. Alle 6 Klone zeigten mit bis zu 10 Kontrollseren 
keine Reaktion. 

Es wurde begonnen, die RT-PCR-Ergebnisse mittels Northern 
Analysen zu guantif izieren. Solche Antigene, die sich in Normal- 
Geweben im Vergleich zu Tumorproben nicht als gleich stark 
exprimiert erweisen, werden als potentielle Therapeutika 
eingestuf t . 
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Mittels RT-PCR- Analysen konnte gezeigt werden, daS die se-2-5- 
spezifische mRNA beinahe ubiquitar innerhalb normaler Gewebe 
exprimiert wird, jedoch nicht in aktivierten T-Zellen und nur in 
lediglich 55% der CTCL-Gewebeproben. Im Gegensatz dazu ergab die 
Northern-Blot-Analyse selbst innerhalb normaler Gewebe ein 
eingeschranktes Expressionsmuster. Starke Signale waren in 
Niere, Luftrohre und Testis nachweisbar, schwachere in Kolon, 
Dunndarm, Thymus, Knochenmark und Magen. Wahrend in alien 
positiven normalen Geweben drei Banden nachweisbar waren {5,2, 
4,2 und 3,9 kB) zeigte die einzige positive CTCL-Zellinie SeAx 
ein Signal bei 3,9 kb. 

Spezifische mRNAs fur die Klone se20-10 und se57-l wurden 
mittels RT-PCR in 43% bzw. 21% der untersuchten Kontrollgewebe 
gefunden. Interessanterweise war die Expression der fur se57-l 
spezif ischen mRNA in alien Tumorgeweben und Zellinien sehr stark 
herunterreguliert . Im Gegensatz dazu war die Expression der mRNA 
von Klon se70-2 im Vergleich zu normalen Geweben (54%) innerhalb 
der CTCL- und Leukamie-Zellinien hochreguliert (100%) , wahrend 
die CTCL-Gewebe und M e 1 a n om - Z e 1 1 i n i e n mittlere 
Expressionsspiegel zeigten (33% bzw. 45%) . Unter den 
Kontrollgeweben waren alle fotalen Gewebe in der RT-PCR positiv. 

Fur zwei Antigene mit Homologien zu bekannten Sequenzen zeigte 
sich eine dif f erentielle Expression: se33-l cDNA ist homolog zu 
NP220, einem DNA-bindenden Protein, und se89-l cDNA ist homolog 
zu RAP140, einem Retinoblastom-assoziierten Klon. Klon se33-l 
zeigte innerhalb einer iiberlappender Strecke von 3 83 0 bp am 3'- 
Ende von NP220 99% Ahnlichkeit, dieser Klon ist jedoch am 5'- 
Ende verkurzt, was zu einem verkurzten ORF fuhrt. Die RT-PCR 

(unter Verwendung se33-l-spezif ischer Primer) erbrachte den 
Nachweis von mRNA in 6/8 fotalen und 16/20 normalen Geweben 

(Tabelle 5) sowie innerhalb von CTCL-Geweben (12/16), 
aktivierten zytotoxischen T-Zellen und in den meisten Zellinien 

(Tabelle 4) . 

cDNA des Klons se89-l zeigte 98% Ahnlichkeit zu RAP140 innerhalb 
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eines \iberlappenden 7 Bereichs von 3444 bp und eine Lucke von 60 
bp, die innerhalb des ORF liegt und zu einer Aminosaure-Liicke 
von 20 Minosauren fuhrt. RT-PCR wurde mit verschiedenen Primern 
durchgef uhrt : Zuerst mit der Primerkombinatiori RAP140 (siehe 
Tabelle 1 sowie Beispiel 1) , wobei sowohl RAP140 als auch se89-l 
nachgewiesen wurden und sich drei Banden in Testis-cDNA und zwei 
Banden in verschiedenen anderen cDNAs zeigten. Zur 
Spezif izierung der Expression von se89-l wurde ein neuer 
reverser Primer (s. Tabelle 1) entworfen, der die Lucke 
innerhalb se89-l iiberspannt. Unter Verwendung dieses Primers 
zusammen mit dem Vorwarts -Primer gegen RAP140, der ebenfalls 
se89-l nachweist, wurde nur eine Bande amplif iziert . Die 
Haufigkeit der positiven cDNAs zu den se89-l-spezif ischen Primer 
unterschied sich nicht wesentlich zwischen den Kontrollgeweben 
(79%) , CTCL-Geweben (75%) und Zellinien (CTCL- und Leukamie- 
Zellinien: 100%, Melanom-Linien: 73%) • Mittels Northern-Blot- 
Analysen konnte die Gegenwart von fur se89-l spezifischer mRNA 
innerhalb von mRNA. bestatigt werden, die von Him, Niere, Kolon 
und Testis und der CTCL-Linie SeAx stammte. 



(B) 

Sechs zu bekannten Sequenzen homologe 1 Antigene (sel-1, se2-2, 
sel4-3, se20-4, se20-9 und se37-2) erwiesen sich als ubiquitar 
exprimiert. In alien Kontrollgeweben (n=28) war fur diese Klone 
spezif ische mRNA uber RT-PCR nachweisbar. In den zwei Klonen 
sel4-3 und se2 0-4 war en alle Tumorgewebe und Zellinien ebenfalls 
in der RT-PCR positiv. Im Gegensatz dazu wurden die Klone 562-2, 
se20-7, se20-9 und se37-2 nur in einer Untergruppe der Melanom- 
und Leukamie-Zellinien exprimiert, wahrend CTCL-Gewebe und CTCL- 
Zellinien einen hoheren Prozentsatz von in der RT-PCR positiven 
cDNAs zeigten. 

Die Reaktivitat von Patientenseren mit diesen Klonen lag im 
Durchschnitt bei etwa 29%, wobei auch zwei Extreme zu beobachten 
waren: Die Reaktivitat gegen den Klon sel4-3 zeigte sich in 11% 
(1/9) und gegen den Klon sel-1 in 50% (5/10) CTCL-Seren. Zwei 
Kontrollseren (n=10) reagierten mit Klon se2 0-6, der zu Klon 



32 



0238803A2 I > 



WO 02/38803 PCT/DEO 1/04229 

se20-4 homolog ist. Fur se2 0-6 konnte gezeigt werden, dafi dieser 
fur ein unterschiedliches Peptid (72 aa) im ersten Leserahmen 
kodiert, das weder in se20-4 noch seinem homologen Gen 
HRIHFB2216 vorhanden war. Die Seguenzanalyse dieser Klone und 
ein Vergleich mit den homologen Gegenstucken offenbarte in 
einigen Fallen Insertionen, Deletionen oder Elongationen. 



Es muE betont werden, daS alle getesteten Klone serologisch 
spezifisch sind. 

Beispiel 6: Sequenzanalysen hinsichfclich Lgl-2 

Es konnten eine Reihe weiterer Klone mit groSer Ubereinstimmung 
zu L»gl-2 isoliert werden, die in 3 ' -Richtung komplettiert waren 
(Stop-Codon und 3 ■ -untrans la tier te Region vorhanden). Dies ist 
in Fig. 24 dargestellt. Diese Klone lie£en sich in einem Gen 
(GBP-TA) zusammenf assen, das sich dem Chromosom lp22.3 zuorden 
liefi. Dabei konnten zwei Splicing -Varianten unterschieden 
werden: GBP-TA wurden 12 Exons zugeordnet, wahrend bei GBP-TA shor ; 
Exon Nuiraner 2 f ehlte . 



Aus GBP-TA lie£ sich ein Protein ableiten, das gewisse 
Homologien zu den bekannten Guanylat-bindenden Proteinen GBP-1, 
GBP-2 und HGBP (US-A-5 , 871 , 965 ) aufweist. Die Sequenz von HGBP 
beinhaltet aber nicht Exon 2 . 



Beispiel 7 : Kxpressionsanalysen hinsichtlich GBP-TA 

Zur Analyse der Expression von GBP-TA wurden RT-PCR Experimente 
durchgef uhrt . Es wurden zwei verschiedene Primerpaare (s. Fig. 
24) zur Unterscheidung der beiden Splicing-Varianten verwendet. 
Dabei wurde eine groSe Zahl von Kontroll-cDNas verwendet, die 
jeweils aus einer Sammlung von Geweben verschiedener Spender 
hergestellt wurden. Wahrend 11 Kontroll-Gewebe fur beide Primer 
nagativ waren, wurden in 5 Geweben GBP-TA short , und in nur 2 
Geweben (Knochenmark und Magen) beide Varianten von GBP-TA 
nachgewiesen (Tabelle 6) . 
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in adulten 



Kont r o 1 1 gewebe 



Ergebnis 



Primerset I 



Primersetll 



Him, Colon, Herz, 
Niere, Leber, Ovar, 
Lunge, PMNC, Prostata 
Testis, Thymus, 
Trachea 

■\ 

Plazenta, Diinndarm, 

Milz, aktiv. CD8 - + 

T-Zellen, Uterus 

Knochenmark, Magen + + 

Im Gegensatz zu den Kontrollgeweben wurde GBP-TA in 
verschiedenen Tumorgeweben mittels RT-PCR nachgewiesen: Kutane 
T-Zell-Lymphome (26%, n=19) , Tumore aus dem HNO-Sereich (21%, 
n=14) . GBP-TAghort wurde in 20% der HNO-Tumore (n=15) und 9% der 
Kolon-Karzinome (n=35) gefunden. Se57-1 wurde in 20% der 
Colonkarzinome (n=35) und 57% der HNO-Tumore (n=28) 
nachgewi esen. 

Da die RT-PCR aufierst sensitiv ist und keine Aussage iiber das 
Vorhandensein und die Menge an Protein zulaSt, wurde die 
Expression mittels Western Blot und eines GBP-TA spezifischen 
Antikorpers tiberpruft. Von den RT-PCR positiven Kontrollen 
konnten mehrere als Protein-Medleys im Western Blot getestet 
werden: Plazenta, Dunndarm, Milz, f 6 tale Leber, Magen, Testis, 
Uterus. Diese erwiesen sich ebenso wie andere getestete 
Kontrollprotein-Medleys (Brustdruse, Testis) als negativ, 
wahrerid Proteine gewonnen aus Tumor (CTLC) -Zellinien (SeAx, 
MyLa, Hut-78, HH; Isolierung uber Tristar, AGS, Heidelberg) eine 
deutliche Bande in der entsprechenden GroSe zeigten. Dies 
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beweist eine Eignung von GBP-TA als spezifische Zielstruktur zur 
Therapie . 

Beispiel 8: Herstellung von Antikorpern gegen GBP-TA 

Zur Herstellung eines GBP-TA-spezif ischen Antikorpers wurde das 
Insert eines Klons, das die Basen 539 bis einschliefilich 1991 
von GBP-TA umfafit, in einen His-Vektor kloniert und in E-coli 
exprimiert. Das rekombinante Protein wurde liber eine Nickel- 
Saule auf gereinigt , anschlieSend zur weiteren Reinigung in einem 
SDS-Gel aufgetrennt und die entsprechende Bande ausgeschnitten. 
Mit dem ausgeschni t tenen Gelstiick wurde ein Kaninchen 
iiranmunisiert , dessen Praimmunserum nicht mit dem Antigen 
reagierte . 



Immuni s i erunqspr o toko 1 1 fur polvklonale Antikoruer im Kaninchen 

Pro Immuni sierung werden 600 fig gereinigtes KLH-gekoppeltes 
Peptid in 0,7 ml PBS und 0,7 ml komplettem bzw. inkomplettem 
Freund's Adjuvans eingesetzt. 



Tag O: 

(komplettes Freund's Adjuvans) 
Tag 14: 



Tag 28 
Tag 56 
Tag 80 



1. Immunisierung 

2 . Immunisierung 
( inkomplettes Freund ■ s 
Adjuvans; icFA) 

3. Immunisierung (icFA) 

4. Immunisierung (icFA) 

Ausbluten 



Das Serum des Kaninchens wird iiti Immunoblot getestet. Hierzu 
wird das zur Immunisierung eingesetzte Peptid einer SDS- 
Polyacrylamid-Gelelektrophorese unterzogen und auf ein Nitrocel- 
lulosefilter tibertragen (vgl. Khyse-Andersen, J . , J • Biochem. 
Biophys. Meth. 10, (1984), 203-209)- Die Western Blot-Analyse 
wurde wie in Bock, C.-T. et al . , Virus Genes 8, (1994), 215-229, 
beschrieben, durchgefuhrt . Hierzu wird das Nitrocellulosef ilter 
eine Stunde bei 37°C mit einem ersten Antikorper inkubiert. 
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Dieser Antikorper is't das Serum des Kaninchens (1:10000 in PBS) . 
Naclx mehreren Waschschritten mit PBS wird das Nitrocellulosef il- 
ter mit einem zweiten Antikorper inkubiert. Dieser Antikorper 
ist ein mit alkalischer Phosphatase gekoppelter monoklonaler 
Ziege Anti-Kaninchen-IgG-Antikorper (Dianova) (1:5000) in PBS. 
Nach 30-miniitiger Inkubation. bei 37°C folgen mehrere 
Waschschritte mit PBS und anschliefiend die alkalische 
Phosphatase-Nachweisreaktion mit Entwicklerlosung (36fiK 5' 
Bromo-4-chloro-3-indolylphosphat , 400/xM JSfitroblau-tetrazolium, 
lOOmM Tris-HCl, pH 9,5/ 100 mM NaCI, 5 mM MgCl 2 ) bei 
Raumtemperatur , bis Banden sichtbar werden. 

Es zeigt sich, daS erf indungsgemafie, polyklonale Antikorper 
hergestellt werden konnen. 



Beispiel 9: ELISA 

Das gleiche GBP-TA Insert, das zur Antikorpergewinnung verwendet 
wurde (Basen-Nr. 539 bis einschl. 1991 von GBP-TA) wurde in 
einen pGEX-Vektor kloniert, rekombinant exprimiert und in einem 
GST-ELISA eingesetzt . Das verwendete ELISA- System lehnt sich an 
Sehr et al . (»J. of Immunol. Meth. 2001, 253 , 153-162) an. 
Hierfiir wurden Glutathion-Casein beschichtete ELISA-Platten mit 
dem Fusionsprotein beladen und anschliefiend Seren von CTCL 
Patienten und Kontrollpersonen auf das Vorhandensein von 
spezifischen Antikorpern getestet. Dabei zeigte sich, daE 17% 
der CTCL-Seren (n=60) , aber nur 2% der Kontrollseren (n=99 ) mit 
dem Fusionsprotein GST-GBP-TA reagierten. 

Der EL ISA eignet sich fur alle angegebenen. Marker ant igene fur 
diagnostische Zwecke , zur Prognose-Abschat zung und zur 
Verlauf skontrolle . 
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Patent anspruche 



1. Diagnostische Zusammensetzung, die mindes tens eine 
Nukleinsauresequenz enthalt, deren veranderte Expression mit 
einer Tumor-Erkrankung assoziiert ist , wobei die 
Nukleinsauresequenz se2-5 (Fig.l) , se20-10 (Fig. 2), se57-l 
(Fig. 3), se70-2 (Fig. 4), Lgl-2 (Fig. 5), sel-1 (Fig. 6), se2-l 
(Fig. 7), se2-2 (Fig. 8), sel4^3 (Fig. 9), se20-4 (Fig. 10), se20-7 
(Fig. 11), se20-9 (Fig. 12), se33-l (Fig. 13), se37-2 (Fig. 14), 
se89-l (Fig. 15), L14-2 (Fig. 16), L15-7 (Fig. 17), Li9-1 (Fig. 18), 
Li9-4 (Fig. 19), Lii5-2 (Fig. 20), Liil0-6 (Fig. 21), Liii4-5 
(Fig. 22) Oder GPB-TA (Fig. 23) umfaEt. 

2. Arzneimittel , das mindestens eine Nukleinsauresequenz 
enthalt, deren veranderte Expression mit einer Tumor-Erkrankung 
assoziiert ist, wobei die Nukleinsauresequenz se20-10 (Fig. 2) , 
se57-l (Fig. 3), Lgl-2 (Fig. 5), sel-1 (Fig. 6), se2-l (Fig. 7) , 
se2-2 (Fig. 8), sel4-3 (Fig. 9), se20-7 (Fig. 11), se20-9 (Fig. 12), 
se33-l (Fig. 13), se37-2 (Fig. 14), L14-2 (Fig. 16), L15-7 
(Fig. 17), Li9-1 (Fig. 18), Li9-4 (Fig. 19) , Dii5-2 (Fig. 20), 
LiilO-6 (Fig. .21), Liii4-5 (Fig. 22) oder GBP-TA (Fig. 23) 
umf aSt . 

3 . Diagnostische Zusammensetzung nach Anspruch 1 oder 
Arzneimittel nach Anspruch 2, wobei die mindestens eine 
Nukleinsauresequenz, deren veranderte Expression mit einer 
Tumor-Erkrankung in Zusammenhang steht, eine Nukleinsauresequenz 
umf aSt , 

(a) die sich von einer in Anspruch 1 oder 2 definierten 
Nukleinsauresequenz in der Codonsequenz aufgrund der 
Degeneration des genetischen Codes unterscheidet ; 

(b) die mit einer in einem der Anspruche 1, 2 oder 3(a) 
definierten Nukleinsauresequenz hybridisiert ; oder 

(c) die ein Fragment, eine allelische Variante oder eine andere 
Variante einer in einem der Anspruche 1, 2, 3(a) oder 3(b) 
definierten Nukleinsauresequenz ist. 
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4. Nukleinsauresequenz entsprechend der Definition nach einem 
der Anspriiche 1 bis 3, die eine cDNA oder genomische DNA ist. 

5. Protein, dessen veranderte Konzentration mit einer Tumor- 
Erkrankung in Zusammenhang steht und das von einer 
Nukleinsauresequenz nach einem der Anspriiche 1 bis 4 kodiert 
ist. 

6. Diagnostische Zusammensetzung, die mindestens einen Vektor 
enthaltend eine der Nukleinsauresequenzen nach Anspruch 1 oder 
3, mindestens ein von einer Nukleinsauresequenz nach Anspruch 1 
oder 3 kodiertes Protein oder mindestens einen gegen dieses 
Protein gerichteten Antikorper enthalt. 

7. Diagnostische Zusammensetzung nach Anspruch 6 zur Diagnose 
oder Verlauf skontrolle einer Tumorerkrankung. 

8. Diagnostische Zusammensetzung nach Anspruch 7, wobei diese in 
Form eines ELISA, Protein-Chips, Nukleinsaure-Chips oder einer 
mit DNA, RNA oder Protein beladener Membran bereitgestellt wird. 

9. Arzneimittel, das mindestens einen Vektor enthaltend eine der 
Nukleinsauresequenzen nach Anspruch 2 oder 3, mindestens ein von 
einer Nukleinsauresequenz nach Anspruch 2 oder 3 kodiertes 
Protein oder mindestens einen gegen dieses Protein- gerichteten 
Antikorper enthalt. 

10. Arzneimittel nach Anspruch 9 zur Therapie von 
Tumorerkrankungen . 

11. Verwendung einer Nukleinsauresequenz nach einem der 
Anspriiche 1 bis 4 zur Diagnose und/oder Therapie einer 
Tumorerkrankung . 
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12 . Verwendung mindestens eines von einer Nukleinsauresequenz 
nach einem der Anspruche 1 bis 4 kodierten Proteins zur Diagnose 
und/oder Therapie einer Tumorerkrankung. 

13 . Verwendung mindestens eines gegen ein von einer 
Nukleinsauresequenz nach einem der Anspruche 1 bis 4 kodierten 
Proteins gerichteten Antikorpers zur Diagnose und/oder Therapie 
einer Tumorerkrankung. 

14. Verwendung nach Anspruch 12 oder 13 als Vakzinierungsmittel . 

15. Verwendung nach Anspruch 12 zur Erzeugung Peptid-beladener 
Antigen-prasentierender Zellen (APC) . 

16. Verwendung nach Anspruch 12 zur Erzeugung tumorspezif ischer 
T- Zellen. 

17. Diagnostische Zusammensetzung nach Anspruch 1, 3 oder 6/ 
Arzneimittel nach Anspruch 2, 3 oder 9, Verwendung nach einem 
der Anspruche 11 bis 17, wobei der Tumor CTCL ist. 
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se2-5 2234 bp 1 ^ 44 

BASE COUNT 711 a 470 c . 566 g 487 t 

ORIGIN 



1 


aggatgagga 


tgggacagaa 


gaggataaca 


gtcgtgttga 


61 


cgggtttgga 


gcatataccc 


aacttttctc 


tggatgatat 


121 


ccaacgatgg 


agggcctctg 


ggaatccatg 


tagtgccttt 


181 


ccctggggtt 


attagtaaaa 


cgattggaga 


aaggtggtaa 


241 


aaatcttttt 


cgtgagaatg 


attgcattgt 


caggattaat 


301 


aagatttgaa 


caagcacaac 


atatgtttcg 


ccaagccatg 


361 


ccatgtggtt 


cctgcagcaa 


ataaagagca 


gtatgaacaa 


421 


caattactat 


tcaagccgtt 


ttagccctga 


cagccagtat 


481 


cagtgcaggg 


cttcacacgg 


tgcagagagc 


accccgactg 


541 


agactctcac 


tcaagactac 


ctcatagcgc 


acacccctcg 


601 


agcctcggca 


cctcagaatg 


tatttagtac 


gactgtaagc 


661 


aataggcaag 


aggcttaata 


tccagcttaa 


gaaaggtaca 


721 


cacttccaga 


gatgtaacaa 


taggtggctc 


agctccaatc 


781 


ccggggggcg 


gccattcagg 


atggccgact ..taaggcagga 


841 


tggagtagat 


ttagtgggca 


aatcccaaga 


ggaagttgtt 


901 


gatggaagga 


actgtgagcc 


ttctggtctt 


tcgccaggaa 


961 


actgaatgca 


gagccaagcc 


acratcjcacrat: 


tccaaaagaa 


1021 


tattgttctt 


acacctgatg 


gcaccaggga 


atttctgaca 


1081 


ttcaggatct 


gcaggccttg 


gtgtcagtgt 


caaaggtaac 


1141 


agatttggga 


atctttgtca 


agtccattat 


taatggagga 


1201 


gcttcgggtg 


aatgatcaac 


tgatagcagt 


aaatggagaa 


1261 


ccaagatgcc 


atggaaaccc 


taagaaggtc 


tatgtctact 


1321 


gatccagctt 


attgttgcaa 


ggagaataag 


caagtgcaat 


1381 


cccccctgga 


cctgagctgc 


ccattgaaac 


agcgttggat 


1441 


ccattccctc 


tacagtggga 


ttgaggggct 


tgatgaatcg 


1501 


cagtaggata 


atgggtgagt 


caggtaaata 


ccagctgtcc 


1561 


agatgacact 


gtcattatag 


aagatgacag 


gttgccagtg 


1621 


ccagtcctct 


tccagctccc 


atgatgatgt 


ggggtttgtg 


1681 


ggccaaggct 


gcaatcagtg 


attcagccga 


ctgctctttg 


1741 


tcttgctttt 


caacgagaag 


gatttggacg 


tcagatagct 


1801 




cacraaaacao 


gttctcccag 


cagagatgtg 


1861 


gaagtcaagc 


tcgttggaga 


gtctgcagac 


cgcagttgcc 


1921 


tattcctttc 


catcgtccac 


ggccgcggat 


aatcagaggc 


1981 


cagagctgcc 


atcgacaaat 


cttatgataa 


acccgcggta 


2041 


ggagaccttg 


gaagaagaca 


cagaagaaag 


ttcaagatca 


2101 


agccagtgat 


cagccttccc 


actctctgga 


gagacaaatg 


2161 


tgataagact 


gatagaaaaa 


aaaaaaaaaa 


aaaaaaaaaa 


2221 


aaaaaaaaaa 


aaaa 
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acctgttgga catgctgaca 
ggtaaagctc gtagaagtcc 
cagtgctcga ggcggcagaa 
agctgaacat ctgaacatga 
gatggcgacc ttcgaaatag 
cgtacaccca tcatttggtt 
ctatcccaaa gtgagaagaa 
attgacaaca ggagtgtgaa 
aaccacccgc ctgagcagat 
ggaaaaccac catccgctcc 
agtggttata acaccaaaaa 
gaaggtttgg aattcagcat 
tatgtgaaaa acattctccc 
gacagactta tagaggtaaa 
tcgctgttga gaagcaccaa 
gacgccttcc acccaaggga 
acgaaagcag aagatgagga 
tttgaagtcc cacttaatga 
cggtcaaaag agaaccacgc 
gcagcatcta aagatggaag 
tccctgttgg gcaagacaaa 
gaaggcaata aacgaggaat 
gagctgaagt cacctgggag 
gatagagaac gaagaatttc 
cccagcagaa atgctgccct 
cctacagtga atatgcccca 
cttcctccac atctctctga 
acggcagatg ctggtacttg 
agtccagatg ttgatccagt 
gacgagacta aactcaatac 
ggtccttccc tgggtctgaa 
gaggtgactt tgaatgggga 
aggggatgca atgagagctt 
gatgatgatg atgaaggcat 
gggagagagt ctgtatccac 
aatggaaacc aagagaaagg 
aaaaaaaaaa aaaaaaaaaa 

Fig. 1 (1) 
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se2-5 protein aaj^6-l 

1 mfrqamrtpi iwfhvvpaan keqyeqlsqs eknnyyssrf spdsqyidnr svnsaglhtv 

61 qraprlnhpp eqidshsrlp hsahpsgkpp sapasapqnv fsttvssgyn tkkigkrlni 

121 qlkkgtegle fsitsrdvti ggsapiyvkn ilprgaaiqd grlkagdrli evngvdlvgk 

181 sqeevvsllr stkmegtvsl lvfrgedafh prelnaepsq mqipketkae dedivltpdg 

241 trefltfevp lndsgsaglg vsvkgnrske nhadlgifvk siinggaask dgrlrvndql 

301 iavngesllg ktnqdametl rrsmstegnk rgmiqlivar riskcnelks pgsppgpelp 

361 ietalddrer rishslysgi egldespsrn aalsrimges gkyqlsptvn mpqddtviie 

421 ddrlpvlpph lsdqsssssh ddvgfvtada gtwakaaisd sadcslspdv dpvlafqreg 

481 fgrqiadetk lntvddqkag spsrdvgpsl glkksssles Iqtavaevtl ngdipfhrpr 

541 priirgrgcn esfraaidks ydkpavdddd egmetleedt eessrsgres vstasdqpsh 

601 slerqmngnq ekgdktdrkk kkkkkkkkkk kkkkkkk 

Jl Fig. 1 (2) 
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se20-10 1991 bp 3 ^ 44 

BASE COUNT 776 a 360 c 392 g 4 63 t 

ORIGIN 

1 aaaacgcttt ttgcatacaa gcaggaaaat gagatgttat ccagtagtag agatcagaga 
61 gttgtgacat ctgaggacca agttcaagaa gggactaaag tgctgaaact taaaacaaaa 
121 atggctgata aagaaaacat gaagagacct gcagagagca aaaataatac agtggtgggg 
181 aaacattgta ttcctttaaa accttcaaat gaactaacca attcaactgt agtaattgac 
241 acacataaac ctaaggatag taatcaaact ccgcatttgt tactaactga agatgatccc 
301 caaagtcaac atatgacatt aagccaggca tttcacctta aaaacaatag taaaaagaaa 
361 caaatgacta cagaaaaaca aaagcaagat gctaacatgc ccaagaaacc tgtgcttgga 
421 tcttatcgtg gccagattgt tcagtctaag attaattcat ttagaaaacc tctacaagtc 
481 aaagatgaga gttctgcagc aacaaagaaa ctttcagcca ctatacctaa agccacaaaa 
541 cctcagcctg taaacaccag cagtgtaaca gtgaaaagta atagatcctc caataagact 
601 gccactacta aatttgtgag cactacatct cagaacacac aacttgtgcg acctcctatt 
661 agaagtcatc acagtaatac ccgggacact gtgaaacaag gcatcagtag aacctctgcc 
721 aatgttacaa tccggaaagg gcctcatgaa aaagaactat tacaatcaaa aacagcttta 
781 tctagtgtca aaaccagttc ttctcaaggt ataataagaa ataagactct atcaagatcc 
841 atagcatctg aagttgtagc caggcctgct tcattgtcta atgataaact gatggaaaag 
901 tcagagcccg ttgaccagcg aagacatact gcaggaaaag caattgttga tagtagatca 
961 gctcagccca aagaaacctc ggaagagaga aaagctcgtc tgagtgagtg gaaagctggc 
1021 aaaggaagag tgctaaaaag gccccctaat tcagtagtta ctcagcatga gcctgcagga 
1081 caaaatgaaa aaccagttgg gtctttttgg actaccatgg cagaagaaga tgaacaaaga 
1141 ttatttactg aaaaagtaaa caacacattt tctgaatgcc tgaacttgat taatgaggga 
1201 tgtccaaaag aagatatact ggtcacactg aatgacctga ttaaaaatat tccagatgcc 
1261 aaaaagcttg ttaagtattg gatatgtctt gcacttattg aaccaatcac aagtcctatt 
1321 gaaaatatta ttgcaatcta tgagaaagcc attctggcag gggctcagcc tattgaagag 
1381 atgcgacaca cgattgtaga tattctaaca atgaagagtc aagaaaaagc taatttagga 
1441 gaaaatatgg agaagtcttg tgcaagcaag gaagaagtca aagaagtcag tattgaagat 
1501 acaggtgttg atgtagatcc agaaaaactg gaaatggaga gtaaacttca tagaaatttg 
15 61 ctatttcaag attgtgaaaa agagcaagac aacaaaacaa aagatccaac ccatgatgtt 
1621 aaaaccccca atacagaaac gaggacaagt tgcttaatta aatataatgt gtctactacg 
1681 ccatacttgc aaagtgtgaa aaaaaaaggt gcagtttgat ggaacaaatt ccgcatttaa 
1741 agagctgaag tttttaacac cagtgagacg ttctcgacgt cttcaagaga aaacttctaa 
1801 attgccagat atgttaaaag atcattatcc ttgtgtgtct tcattggaac agctaacgga 
18 61 gttgggaaga gaaactgatg cttttgtatg ccgccctaat gcagcactgt gccgggtgta 
1921 ctatgaggct gatacaacat aagagaaata aagctctgtt agggaaaaaa aaaaaaaaaa 
1981 aaaaaaaaaa a 

N Fig. 2 (1) 
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se20-10 protein st^&a 4/44 

1 mlsssrdgrv vtsedqvgeg tkvlklktkm adkenmkrpa esknntvvgk hciplkpsne 
61 ltnstvvidt hkpkdsngtp hlllteddpq sqhmtlsgaf hlknnskkkg mttekqkqda 
121 nmpkkpvlgs yrggivgski nsfxkplgvk dessaatkkl satipkatkp gpvntssvtv 
181 ksnrssnkta ttkfvsttsg ntqlvrppir shhsntrdtv kggisrtsan vtirkgphek 
241 ellqsktals svktsssggi irnktlsrsi asevvarpas lsndklmeks epvdqrrhta 
301 gkaivdsrsa gpketseerk arlsewkagk grvlkrppns vvtghepagg nekpvgsfwt 
361 tmaeedegrl ftekvnntfs eclnlinegc pkedilvtln dliknipdak klvkywicla 
421 liepitspie niiaiyekai lagagpieem rhtivdiltm ksqekanlge nmekscaske 
481 evkevsiedt gvdvdpekle mesklhrnll fqdcekeqdn ktkdpthdvk tpntetrtsc 
541 likynvsttp ylgsvkkkga v 

// 

Fig- 2 (2) 
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BASE COUNT 1375 a 662 c 743 g 1217 t 

ORIGIN 



1 


ctggccccaa 


ggtccgatcg 


cccaggggag 


gagcagcacc 


gggaccccgc 


gtcggctggg 


61 


cgccccacaa 


gggaagccag 


tcttaatatg 


atggaaacat 


ctctgaactt 


ctaaaagacc 


121 


aaggttggcg 


ttttagctct 


attaatttta 


ettegtcttg 


gecagaatte 


acaatgacaa 


181 


cagtgacagt 


gaccacagaa 


attcccccaa 


gggataagat 


ggaagataat 


tetgecttgt 


241 


atgagtctac 


gtccgctcac 


attattgaag 


aaaccgagta 


tgtgaaaaag 


attcgaacta 


301 


ctctgcaaaa 


gatcaggacc 


cagatgttta 


aagatgaaat 


aagacatgac 


agtacaaatc 


3 61 


acaaactaga 


tgcaaagcac 


tgtggaaacc 


ttcaacaggg 


ctctgattct 


gaaatggatc 


421 


cttcttgttg 


cagtttggat 


ttgcttatga 


aaaagataaa 


aggaaaagac 


ctacagctct 


481 


tagaaatgaa 


caaagagaat 


gaagtattga 


aaatcaagct 


gcaagcctcc 


agagaagcag 


541 


gagcagcagc 


tctgagaaac 


gtggcccaga 


gattatttga 


aaactaccaa 


aegcaatctg 


601 


aagaagtgag 


aaagaagcag 


gaggacagta 


aacaattact 


ccaggttaac 


aagcttgaaa 


661 


aagaacagaa 


attgaaacaa 


catgttgaaa 


atctgaatca 


agttgctgaa 


aaacttgaag 


721 


aaaaacacag 


tcaaattaca 


gaattggaga 


accttgtaca 


gagaatggaa 


aaggaaaaga 


781 


gaacactact 


agaaagaaaa 


ctgtctttgg 


aaaacaagct 


actgcaactc 


aaatccagtg 


841 


ctacatatgg 


aaaaagttgc 


caggatcttc 


agagggagat 


ttccattctc 


caggagcaga 


901 


tctctcatct 


gcagtttgtg 


attcactccc 


aacatcagaa 


cctgcgcagt 


gtcatccagg 


961 


agatggaagg 


attaaaaaat 


aatttaaaag 


aacaagacaa 


aagaattgaa 


aatctcagag 


1021 


aaaaggttaa 


catacttgaa 


g'cccagaata 


aagaactaaa 


aacccaggta 


gcactttcat 


1081 


ctgaaactcc 


taggacaaag 


gtatctaagg 


ctgtctctac 


aagtgaattg 


aagaccgaag 


1141 


gt gtttcccc 


ttatttaatg 


ttgattaggt 


tacggaaatg 


aactggctgg 


atgaagatct 


1201 


gatttagaaa 


gactgcgtga 


gtcttattta 


ttctctgaaa 


cacagcccaa 


gtttcatgtt 


12 61 


aaaatggcaa 


aatgccatta 


tttaaatgga 


acttattaca 


taccaatggc 


tttgcaagaa 


1321 


gatgacattt 


cagaagatca 


aacaaat eta 


tatttaatgg 


atggactctt 


caaaacttac 


1381 


caaatagttg 


aagaaaccag 


gtgccttctc 


-atgatggaag 


acagattctg 


ctttaaatta 


1441 


aaaaaaaaaa 


-aaatctgaat 


cttgttttca 


gatttttttt 


tctactggga 


ttgttttaag 


1501 


attgtcaatt 


ctgacttttt 


tatagtggtt 


tttaagagta 


taaatagaag 


ggagagtgta 


1561 


tatgtgtatg 


aatgaacata 


catttcctgc 


atatatatgt 


atgaagggca 


tgtatatgta 


1621 


tgaatgagca 


aacatatttg 


aaagttaact 


tttggatgat 


aggaaagatc 


gtacagtgac 


1681 


ataagttcat 


ctcctgatcc 


attgtttgtg 


ggagaattat 


acttgactga 


attatgggca 


1741 


ggagaaagag 


cagattcctt 


ttagctaatt 


ccccaaccca 


tatgcccctc 


tgaagttgag 


1801 


aatcatggct 


gcctcaccac 


acatcagaga 


atgactgttc 


ttcttagttc 


tgggattaaa 


1861 


aattggtttc 


tagaggtaac 


ctgtacacac 


aaacgcacag 


ggatgeacat 


ggtttcctct 


1921 


gcctttgtga 


ctaattttct 


tcttgatagt 


tattaatagt 


atctaaataa 


aatattgggg 


1981 


ggatagaaaa 


ataatgctgt 


tagctcatac 


ttccatgaaa 


atgtatatat 


tataggctca 


2041 


aaggaataat 


gactgctgtc 


' tgeagecaga 


aagaatctga 


atttatgaat 


tggaaagata 


2101 


tatatagtgt 


atttgtgaaa 


gtttgcttaa 


attctgatac 


atgecttett 


tgtaggtgga 


2161 


gtttgtgatt 


gcagtgaata 


gaacaaattc 


tgacttgcag 


aaatgeagae 


atacagtcag 


2221 


gaaagaacaa 


acttcaatta 


aatgtataat 


gagagacctt 


ggtcccccta 


aaggatgaat 
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2281 


ttcctttagg*~cctttgatct 


tcctctctag 


tgtataactt 


taaata£ttg 


ctcagaaaag 


2341 


atgctgactc 


tttcattatg 


gaatgtgaaa 


tatcagtgtt 


gtctataaat 


atttgaaggt 


2401 


atataaaaat 


gagatgatgt 


aatgtattta 


taaatttatc 


caagtactgt 


aatccttgaa 


2461 


ttgttgtgta 


actgtgtgtg 


agttttatgc 


ttcatggtat 


ttttggaaac 


atttttattg 


2521 


cttgcttatt 


ttgaaggtat 


atttatctgt 


taacatttag 


ggcatagtta 


ccttatacca 


2581 


gcaacaagtc 


taagcacttt 


acttgtatta 


atttatttta 


tcttccccaa 


ggccctcaga 


2641 


agcagattat 


tcctgtttta 


cagagaaaga 


tactgagagt 


ggttgagtaa 


tttgcccagc 


2701 


tgctaactgt 


gaagcaaaaa 


tttgaacctt 


ttgacttggc 


tattgatatt 


cattctactt 


2761 


gctcacatgg 


tggtctaaga 


aatttcccag 


ctatagaaat 


ct ctctattt 


ttgccacttt 


2821 


aatcaacaca 


tagcttcctg 


gatgactgcc 


tgtgttattt 


tgtggatgac 


agtaagaaac 


2881 


aacaaatact 


gataaaatca 


atattttgct 


gaaatgagtt 


gatctttcac 


cagctggact 


2941 


accattgtga 


gaactcagtt 


cagacaaact 


tccctgctaa 


aaatctgttt 


atcatacatt 


3001 


tattatttat 


gactttatgt 


cacattgaag 


aatttcttca 


tgatacattt 


tcaggcacac 


3061 


ttgtaggaaa 


attaggatca 


tgagtcctgc 


tttaagtatt 


tgcagtgtag 


taagagaatc 


3121 


catcttttac 


taggagacca 


gattcctttt 


atacctcatt 


catcatgctg 


gattgtaata 


3181 


aatttcagat 


tttggaatgg 


gcttatttaa 


ctgacctaac 


aatcttgatg 


atttccatta 


3241 


gaataactta 


ttctaaggtc 


aaaagtggaa 


agacactgtt 


ggtttttatt 


ttgatttcac 


3301 


tatactcatt 


tttgaacatg 


gaaatacagt 


ggtgaaacca 


cctatgcaaa 


aatgataaca 


3361 


gtgaggaaat 


tatgacagtg 


aaagagatct 


gacctaacta 


tctatcttgc 


ctcgaaactg 


3421 


cccttggtcg 


ttcctgagtg 


tgggccaagc 


taactttggg 


agaaatttac 


tttataggtt 


3481 


aaattataat 


agcccttccc 


aaaactaaac 


gattctcctg 


cctcagcctc 


ccgagtagct 


3541 


gtctttataa 


taccatcagc 


cttatcattt 


attcgtcatg 


tatggattgt 


ttcctatatc 


3601 


cactatcata 


aaattatcat 


ttgaaatatt 


tttttatgaa 


aaaaaaaaca 


cttctcagtg 


3661 


aaaaaacaag 


attacaaggg 


ggaataatat 


ttattcagct 


aaaatagtac 


ttcacaggaa 


3721 


atataggaaa 


agaaacacta 


gttcagtttt 


attccaaata 


atgtacttct 


aattatactc 


3781 


ttgaatttat 


tggataagaa 


ggtctgaggt 


gggtctgaaa 


ttcatacatg 


aagtcaggaa 


3841 


aagaaaagaa 


acttagttct 


accttgatta 


catatgttgt 


tacaaattat 


cattataaaa 


3901 


tgtttaaaca 


attagtatag 


tatatctttt 


gaataattgc 


ttataatatg 


ccttaccata 


3961 


aagaaaattg 


atgctaaaaa 


aaaaaaaaaa 


aaaaaaa 







se57-l protein 335aa 

1 mttvtvttei pprdkmedns alyestsahi ieeteyvkki rttlqkirtq mf kdeirhds 

61 tnhkldakhc gnlqqgsdse mdpsccsldl lmkkikgkdl qllemnkene vlkiklqasr 

121 eagaaalrnv aqrlfenyqt qseevrkkqe dskqllqvnk lekeqklkqh venlnqvaek 

181 leekhsqite lenlvqrmek ekrtllerkl slenkllqlk ssatygkscq dlqreisilq 

241 eqishlqfvi hsqhqnlrsv iqemeglknn Ikeqdkrien Irekvnilea qnkelktqva 

301 lssetprtkv skavstselk tegvspylml irlrk 



// 



// 
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B70-2 1592 bp 

BASE COUNT 577 a 230 c 335 g 450 t 

ORIGIN 

1 ctgctttgaa ggctgcacag aaaaccttac ttgtttccac ctctgcagtt gataataatg 
61 aagcacagaa aaaaaaacag gaggcattga aacttcagca ggatgtaagg aaaaggaaac 
121 aagaaatttt agaaaagcac attgaaacac agaagatgtt aatttcaaaa ctggagaaaa 
181 acaaaacaat gaagtctgaa gataaagcag aaataatgaa aactttagag gttttgacaa 
241 aaaatattac caagttgaaa gatgaggtca aagctgcttc tcctggacgc tgtcttccaa 
301 aaagtataaa aaccaagact cagatgcaga aggaattact tgacacagaa ctggatttat 
361 ataagaagat gcaggctgga gaagaagtca ctgaacttag gagaaagtat acagaattac 
421 agctggaagc tgccaaacga gggattcttt catctggtcg gggcagagga attcattcaa 
481 gaggtcgagg tgcagttcat ggccgaggca gggggcgagg gcgagggcga ggtgtgcctg 
541 gtcatgctgt ggtggatcac cgtcccaggg cattggagat ttctgcattt acggagagcg 
601 atagagaaga tcttcttcct cattttgcgc aatatggtga aattgaagat tgtcagattg 
661 atgattcctc acttcatgca gtaattacat tcaagacaag agcagaagct gaagcagctg 
721 cagttcatgg agctcgtttc aaagggcaag atctaaaact ggcatggaat aaaccagtaa 
781 ctaatatttc agctgttgaa acagaagaag ttgagcctga tgaagaagaa tttcaggaag 
841 agtctttggt ggatgactca ttacttcaag atgatgatga agaagaagag gacaatgaat 
901 ctcgttcttg gagaagatga tttgactgat cattgatctg catatgctag aactctacct 
961 gtgtttcatt agtattatct aatgtacttt tacatatttg taaaaacaat ttttggtaaa 
1021 atgtgatgaa gatggatttc acaaatagac aaaaaagaag aaaactacct tctgatcttg 
1081 tattttgaaa gattgatgtt tgcattttac ttcagtaaac aattgctaaa gacatcacac 
1141 tagaaacata tgcaatgttt ttattacata cttctactgg acatcacaga attctttggg 
1201 ttctttgtaa tttaatgaat aggtctgaaa acttatgacc aatacttgtt ataacttaga 
1261 ggactttgtt ttattccaaa taaggaatga atttgcattt aaaatcttaa tgaatgtttt 
1321 caaaactgaa tagataacat agtactctaa ctaaagtctc caagttatgt attataatat 
1381 tacatagtag tatgcttagg ctttactatg tattagcctt ttgttggact gtgtatgtat 
1441 tttaccatat gggttttaat gataatggtg tatgactgct ttacatgagt ccttatgcat 
1501 ccagatgtta taataaagtg gaatggtctc tttaaaaaaa aaaaaggaaa gaaaagagaa 
1561 aagcaatgac aaaaaaaaaa aaaaaaaaaa aa 

selO-2 protein 254aa 

1 mliskleknk tmksedkaei mktlevltkn itklkdevka aspgrclpks iktktqmqke 
61 lldteldlyk kmqageevte lrrkytelql eaakrgilss grgrgihsrg rgavhgrgrg 
121 rgrgrgvpgh avvdhrpral eisaftesdr edllphfaqy geiedcqidd sslhavitfk 
181 traeaeaaav hgarfkgqdl klawnkpvtn isaveteeve pdeeefqees lvddsllqdd 
241 deeeednesr swrr 

// 

Fig. 4 
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gl-2 

BASE COUNT 600 a 478c 446 g 456 t 

ORIGIN 

1 aattcggcac gaggttcact ctttgcaata aatcttgctg ctgctcactc tttgggtcca 
61 cactgccttt atgagctgta acactcactg ggaatgtctg cagcttcact cctgaagcca 
121 gcgagaccac gaacccacca ggaggaacaa acaactccag acgcgcagcc ttaagagctg 
181 taacactcac cgcgaaggtc tgcagcttca ctcctgagcc agccagacca cgaacccacc 
241 agaaggaaga aactccaaac acatccgaac atcagaagga gcaaactcct gacacgccac 
301 ctttaagaac cgtgacactc aacgctaggg tccgcggctt cattcttgaa gtcagtgaga 
361 ccaagaaccc accaattccg gacacgctaa ttgttgtaga tcatcacttc aaggtgccca 
421 tatctttcta gtggaaaaat tattctggcc tccgctgcat acaaatcagg caaccagaat 
481 tctacatata taaggcaaag taacatccta gacatggctt tagagatcca catgtcagac 
541 cccatgtgcc tcatcgagaa ctttaatgag cagctgaagg ttaatcagga agctttggag 
601 atcctgtctg ccattacgca acctgtagtt gtggtagcga ttgtgggcct ctatcgcact 
661 ggcaaatcct acctgatgaa caagctggct gggaagaaca agggcttctc tgtgcatcta 
721 cggtgcagtc tcacaccaag ggaatttgga tatggtgtgt gcctcatccc aactggccaa 
7 81 atcacacatt agttctgctt gacaccgagg gcctgggaga tgtagagaag gctgacaaca 
841 agaatgatat ccagatcttt gcactggcac tcttagtgag cagcaccttt gtgtacaata 
901 ctgtgaacaa aattgatcag ggtgctatcg acctactgca caatgtgaca gaactgacag 
961 atctgctcaa ggcaagaaac tcacccgacc ttgacagggt tgaagatcct gctgactctg 
1021 cgagcttctt cccagactta gtgtggactc tgagagattt ctgcttaggc ctggaaatag 
1081 atgggcaact tgtcacacca gatgaatacc tggagaattc cctaaggcca aagcaaggta 
1141 gtgatcaaag agttcaaaat ttcaatttgc cccgtctgtg tatacagaag ttctttccaa 
1201 aaaagaaatg ctttatcttt gacttacctg ctcaccaaaa aaagcttgcc caacttgaaa 
12 61 cactgcctga tgatgagcta gagcctgaat ttgtgcaaca agtgacagaa ttctgttcct 
1321 acatctttag ccattctatg accaagactc ttccaggtgg catcatggtc aatggatctc 
1381 gtctaaagaa cctggtgctg acctatgtca atgccatcag cagtggggat ctgccttgca 
14 41 tagagaatgc agtcctggcc ttggctcaga gagagaactc agctgcagtg caaaaggcca 
1501 ttgcccacta tgaccagcaa atgggccaga aagtgcagct gcccatggaa accctccagg 
1561 agctgctgga cctgcacagg accagtgaga gggaggccat tgaagtcttc atgaaaaact 
1621 ctttcaagga tgtagaccaa agtttccaga aagaattgga gactctacta gatgcaaaac 
1681 agaatgacat ttgtaaacgg aacctggaag catcctcgga ttattgctcg gctttactta 
17 41 aggatatttt tggtcctcta gaagaagcag tgaagcaggg aatttattct aagccaggag 
1801 gccataatct cttcattcag aaaacagaag aactgaaggc aaagtactat cgggagcctc 
1861 ggaaaggaat acaggctgaa gaagttctgc agaaatattt aaagtccaag gagtctgtga 
1921 gtcatgcaat attacagact gaccaggctc tcacagagac ggaaaaaaaa aaaaaaaaaa 



// 



Fig. 5 (1) 
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Lgl-2 protein 2lTaa 9/44 

1 mt ktlpggim vngsrlknlv ltyvnaissg dlpcienavl alaqrensaa vqkaiahydq 
61 qmgqkvqlpra etlqelldlh rtsereaiev fmknsfkdvd qsfqkeletl Idakqndick 
121 rnleassdyc sallkdifgp leeavkqgiy skpgghnlfi qkteelkaky yreprkgiqa 
181 eevlqkylks kesvshailq tdqaltetek kkkk 

// 



Fig- 5 (2) 
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sel-1 2363 bp 

BASE COUNT 1009 a 310 c 463 g 581 t 

ORIGIN 

1 tgaatacgca attagaactt tcagaacaac ttaaatttca gaacaactct gaagataatg 
61 ttaaaaaact acaagaagag attgagaaaa ttaggccagg ctttgaggag caaattttat 
121 atctgcaaaa gcaattagac gctaccactg atgaaaagaa ggaaacagtt actcaactcc 
181 aaaatatcat tgaggctaat tctcagcatt accaaaaaaa tattaatagt ttgcaggaag 
241 agcttttaca gttgaaagct atacaccaag aagaggtgaa agagttgatg tgccagattg 
301 aagcatcagc taaggaacat gaagcagaga taaataagtt gaacgagcta aaagagaact 
361 tagtaaaaca atgtgaggca agtgaaaaga acatccagaa gaaatatgaa tgtgagttag 
421 aaaatttaag gaaagccacc tcaaatgcaa accaagacaa tcagatatgt tctattctct 
481 tgcaagaaaa tacatttgta gaacaagtag taaatgaaaa agtcaaacac ttagaagata 
541 ccttaaaaga acttgaatct caacacagta tcttaaaaga tgaggtaact tatatgaata 
601 atcttaagtt aaaacttgaa atggatgctc aacatataaa ggatgagttt tttcatgaac 
661 gggaagactt agagtttaaa attaatgaat tattactagc taaagaagaa cagggctgtg 
721 taattgaaaa attaaaatct gagctagcag gtttaaataa acagttttgc tatactgtag 
781 aacagcataa cagagaagta cagagtctta aggaacaaca tcaaaaagaa atatcagaac 
841 taaatgagac atttttgtca gattcagaaa aagaaaaatt aacattaatg tttgaaatac 
901 agggtcttaa ggaacagtgt gaaaacctac agcaagaaaa gcaagaagca attttaaatt 
961 atgagagttt acgagagatt atggaaattt tacaaacaga actgggggaa tctgctggaa 
1021 aaataagtca agagttcgaa tcaatgaagc aacagcaagc atctgatgtt catgaactgc 
1081 agcagaagct cagaactgct tttactgaaa aagatgccct tctcgaaact gtgaatcgcc 
1141 tccagggaga aaatgaaaag ttactatctc aacaagaatt ggtaccagaa cttgaaaata 
1201 ccataaagaa ccttcaagaa aagaatggag tatacttact tagtctcagt caaagagata 
1261 ' ccatgttaaa agaattagaa ggaaagataa attctcttac tgaggaaaaa gatgatttta 
1321 taaataaact gaaaaattcc catgaagaaa tggataattt ccataagaaa tgtgaaaggg 
1381 aagaaagatt gattcttgaa cttgggaaga aagtagagca aacaatccag tacaacagtg 
1441 aactagaaca aaaggtaaat gaattaacag gaggactaga ggagacttta aaagaaaagg 
1501 atcaaaatga ccaaaaacta gaaaaactta tggttcaaat gaaagttctc tctgaagaca 
1561 aagaagtatt gtcagctgaa gtgaagtctc tttatgagga aacaataaac tcagttcaga 
1621 aaaaaaaaca gttgagtagg gatttggagg tttttttgtc tcaaaaagaa gatgttatcc 
1681 ttaaagaaca tattactca'a ttagaaaaga aacttcagtt aatggttgaa gagcaagata 
1741 atttaaataa actgcttgaa aatgagcaag ttcagaagtt atttgttaaa actcagttgt 
1801 atggttttct taaagaaatg ggatcagaag tttcagaaga cagtgaagag aaagatgttg 
1861 ttaatgtcct acaggcagtc ggtgaatcct tggcaaaaat aaatgaggaa aaatgcaacc 
1921 tggcttttca gcgtgatgaa aaagtattag agttagaaaa agagattaag tgccttcaag 
1981 aagagagtgt agttcagtgt gaagaactta agtctttatt gagagactat gagcaagaga 
2041 aagttctctt aaggaaagag ttagaagaaa tacagtcaga aaaagaggcc ctgcagtctg 
2101 atcttctaga aatgaagaat gctaatgaaa aaacaaggct tgaaaatcag aatcttttaa 
2161 ttcaagttga agaagtatct caaacatgta gcaaaagtga aatccataat gaaaaagaaa 
2221 aatgttttat aaaggaacat gaaaacctaa agccactact agaacaaaaa gaattacgag 
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2281 .ataggagagc agagttgata ctattaaagg attccttagc aaaatcacct tactgtaaaa 

2341 aatgatacct ctgtcttcag taa 

// 

sel-1 protein 685aa 

1 racqieasake heaeinklne lkenlvkqce asekniqkky ecelenlrka tsnanqdnqi 

61 csillqentf veqvvnekvk hledtlkele sqhsilkdev tymnnlklkl emdaqhikde 

121 ffheredlef kinelllake eqgcvieklk selaglnkqf cytveqhnre vqslkeqhqk 

181 eiselnetfl sdsekekltl mfeiqglkeq cenlqqekqe ailnyeslre imeilqtelg 

241 esagkisqef esmkqqqasd vhelqqklrt aftekdalle tvnrlqgene kllsqqelvp 

301 elentiknlq ekngvyllsl sqrdtmlkel egkinsltee kddfinklkn sheemdnfhk 

3 61 kcereerlil elgkkveqti qynseleqkv neltggleet lkekdqndqk leklmvqmkv 

421 Isedkevlsa evkslyeeti nsvqkkkqls rdlevflsqk edvilkehit qlekklqlmv 

481 eeqdnlnkll eneqvqklfv ktqlygflke mgsevsedse ekdwnvlqa vgeslakine 
541 ekcnlafqrd ekvlelekei kclqeeswq ceelksllrd yeqekvllrk^ eleeiqseke 

601 alqsdllemk nanektrlen qnlliqveev sqtcskseih nekekcfike henlkplleq 
661 kelrdrrael illkdslaks pyckk 

// 

Fig. 6 (2) 
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se2-l 2564 bp 

BASE COUNT * 1111 a 368 c 524 g 561 t 
ORIGIN 

1 ccacgcgctc cgggccgctc aggctgagcg atttcccgcc ttttctgagg ttctgaggcg 
61 ggagccattg gttctttctg ttgccctcat agaccgtatg tagcagttcg cgtgggcaca 
121 gaacccacgg tttcccgcta gttcttcaaa gtagatattt acaaccgtaa cagagaaaat 
181 ggaaaagcaa aagccctttg cattgttcgt accaccgaga tcaagcagca gtcaggtgtc 
241 tgcggtgaaa cctcagaccc tgggaggcga ttccactttc ttcaagagtt tcaacaaatg 
301 tactgaagat gattttgagt ttccatttgc aaagactaat ctctccaaaa atggggaaaa 
361 cattgattca gatcctgctt tacaaaaagt taatttcttg cccgtgcttg agcaggttgg 
421 taattctgac tgtcactatc aggaaggact aaaagactct gatttggaga attcagaggg 
481 attgagcaga gtgtattcaa aactgtataa ggaggctgaa aagataaaaa aatggaaagt 
541 aagtacagaa gctgaactga gacagaaaga aagtaagttg caagaaaaca gaaagataat 
601 tgaagcacag cgaaaagcca ttcaggaact gcaatttgga aatgaaaaag taagtttgaa 
661 attagaagaa ggaatacaag aaaataaaga tttaataaaa gagaataatg ccacaaggca 
721 tttatgtaat ctactcaaag aaacctgtgc tagatctgca gaaaagacaa agaaatatga 
781 atatgaacgg gaagaaacca ggcaagttta tatggatcta aataataaca ttgagaaaat 
841 gataacagct tttgaggaac ttcgtgtgca agctgagaat tccagactgg aaatgcattt 
901 taagttaaag gaagattatg aaaaaatcca acaccttgaa paagaataca agaaggaaat 
961 aaatgacaag gaaaagcagg tatcactact attgatccaa atcactgaga aagaaaataa 
1021 aatgaaagat ttaacatttc tgctagagga atccagagat aaagttaatc aattagagga 
1081 aaagacaaaa ttacagagtg aaaacttaaa acaatcaatt gagaaacagc atcatttgac 
1141 taaagaacta gaagatatta aagtgtcatt acaaagaagt gtgagtactc aaaaggcttt 
1201 agaggaagat ttacagatag caacaaaaac aatttgtcag ctaactga&g aaaaagaaac 
1261 tcaaatggaa gaatctaata aagctagagc tgctcattcg tttgtggtta ctgaatttga 
1321 aactactgtc tgcagcttgg aagaattatt gagaacagaa cagcaaagat tggaaaaaaa 
1381 tgaagatcaa ttgaaaatac ttaccatgga gcttcaaaag aaatcaagtg agctggaaga 
14 41 gatgactaag cttacaaata acaaagaagt agaacttgaa gaattgaaaa aagtcttggg 
1501 agaaaaggaa acacttttat atgaaaataa acaatttgag aagattgctg aagaattaaa 
1561 aggaacagaa caagaactaa ttggtcttct ccaagccaga gagaaagaag tacatgattt 
1621 ggaaatacag ttaactgcca ttaccacaag tgaacagtat tattcaaaag aggttaaaga 
1681 tctaaaaact gagcttgaaa acgagaagct taagaatact gaattaactt cacactgcaa 
1741 caagctttca ctagaaaaca aagagctcac acaggaaaca agtgatatga ccctagaact 
1801 caagaatcag caagaagata ttaataataa caaaaagcaa gaagaaagga tgttgaaaca 
18 61 aatagaaaat cttcaagaaa cagaaaccca attaagaaat gaactagaat atgtgagaga 
1921 agagctaaaa cagaaaagag atgaagttaa atgtaaattg gacaagagtg aagaaaattg 
1981 taacaattta aggaaacaag ttgaaaataa aaacaagtat attgaagaac ttcagcagga 
2041 gaataaggcc ttgaaaaaaa aaggtacagc agaaagcaag caactgaatg tttatgagat 
2101 aaaggtcaat aaattagagt tagaactaga aagtgccaaa cagaaatttg gagaaatcac 
2161 agacacctat cagaaagaaa ttgaggacaa aaagatatca gaagaaaatc ttttggaaga 
2221 ggttgagaaa gcaaaagtaa tagctgatga agcagtaaaa ttacagaaag aaattgataa 
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2281 gcgatgtcaa cataaaatag ctgaaatggt agcacttatg gaaaaacata agcaccaata 

2341 tgataagatc attgaagaaa gagactcaga attaggactt tataagagca aagaacaaga 

24 01 acagtcatca ctgagagcat ctttggagat tgaactatcc aatctcaaag ctgaactttt 

24 61 gtctgttaag aagcaacttg aaatagaaag agaagagaag gaaaaactca aaagagaggc 

2521 aaaagaaaac acagctactc ttaaagaaaa aaaaaaaaaa aaaa 

se2-l protein 795aa 

1 mekqkpfalf vpprssssqv savkpqtlgg dstffksfnk cteddfefpf aktnlsknge 

61 nidsdpalqk vnflpvleqv gnsdchyqeg Ikdsdlense glsrvyskly keaekikkwk 

121 vsteaelrqk esklqenrki ieaqrkaiqe Iqfgnekvsl kleegiqenk dlikennatr 

181 hlcnllketc arsaektkky eyereetrqv ymdlnnniek mitafeelrv qaensrlemh 

241 fklkedyeki qhleqeykke indkekqvsl lliqiteken kmkdltflle esrdkvnqle 

301 ektklqsenl kqsiekqhhl tkeledikvs lqrsvstqka leedlqiatk ticqlteeke 

361 tqmeesnkar aahsfwtef ettycsleel lrteqqrlek nedqlkiltm elqkkssele 

4 21 emtkltnnke veleelkkvl geketllyen kqfekiaeel kgteqeligl lqarekevhd 

481 leiqltaitt seqyyskevk dlktelenek lknteltshc nklslenkel tqetsdmtle 

541 lknqqedinn nkkqeermlk qienlqetet qlrneleyvr eelkqkrdev kckldkseen 

601 cnnlrkqven knkyieelqq enkalkkkgt aeskqlnvye ikvnklelel esakqkfgei 

661 tdtyqkeied kkiseenlle .evekakviad eavklqkeid krcqhkiaem valmekhkhq 

721 ydkiieerds elglykskeq eqsslrasle ielsnlkael lsvkkqleie reekeklkre 

781 akentatlke kkkkk 

// 

Fig. 7 (2) 
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se2-2 2317 bp 

BASE COUNT 999 a 334 c 47 9 g 505 t 

ORIGIN 

1 ctaccaacaa gcattttatt cgtctggctg agatggaaca gacagtagca gaacaagatg 
61 actctctttc ctcactcttg gtcaaactaa agaaagtatc acaagatttg gagagacaaa 
121 gagaaatcac tgaattaaaa gtaaaagaat ttgaaaatat caaattacag cttcaagaaa 
181 accatgaaga tgaagtgaaa aaagtaaaag cggaagtaga ggatttaaag tatcttctgg 
241 accagtcaca aaaggagtca cagtgtttaa aatctgaact tcaggctcaa aaagaagcaa 
301 attcaagagc tccaacaact acaatgagaa atctagtaga acggctaaag agccaattag 

3 61 ccttgaagga gaaacaacag aaagcactta gtcgggcact tttagaactc cgggcagaaa 

4 21 tgacagcagc tgctgaagaa cgtattattt ctgcaacttc tcaaaaagag gcccatctca 
481 atgttcaaca aatcgttgat cgacatacta gagagctaaa gacacaagtt gaagatttaa 
541 atgaaaatct tttaaaattg aaagaagcac ttaaaacaag taaaaacaga gaaaactcac 
601 taactgataa tttgaatgac ttaaataatg aactgcaaaa gaaacaaaaa gcctataata 
661 aaatacttag agagaaagag gaaattgatc aagagaatga tgaactgaaa aggcaaatta 
721 aaagactaac cagtggatta cagggcaaac ccctgacaga taataaacaa agtctaattg 
7 81 aagaactcca aaggaaagtt aaaaaactag agaaccaatt agagggaaag gtggaggaag 
841 tagacctaaa acctatgaaa gaaaagaatg ctaaagaaga attaattagg tgggaagaag 



961 aagtctttac tttaacaaag cagttgaata ctttgaagga tctttttgcc aaagccgata 
1021 aagagaaact tac.tttgcag aggaaactaa aaacaactgg catgactgtt gatcaggttt 
1081 tgggaatacg agctttggag tcagaaaaag aattggaaga attaaaaaag agaaatcttg 



1201 tagaagattt acatttacaa aatagatacc tccaagaaaa acttcatgct ttagaaaaac 
12 61 agttttcaaa ggatacatat tctaagcctt caatttcagg aatagagtca gatgatcatt 
1321 gtcagagaga acaggagctt cagaaggaaa acttgaagtt gtcatctgaa aatattgaac 
1381 tgaaatttca gcttgaacaa gcaaataaag atttgccaag attaaagaat caagtcagag 
1441 atttgaagga aatgtgtgaa tttcttaaga aagaaaaagc agaagttcag cggaaacttg 
1501 gccatgttag agggtctggt agaagtggaa agacaatccc agaactggaa aaaaccattg 
1561 gtttaatgaa aaaagtagtt gaaaaagtcc agagagaaaa tgaacagttg aaaaaagcat 
1621 caggaatatt gactagtgaa aaaatggcta atattgagca ggaaaatgaa aaattgaagg 
1681 ctgaattaga aaaacttaaa gctcatcttg ggcatcagtt gagcatgcac tatgaatcca 
1741 agaccaaagg cacagaaaaa attattgctg aaaatgaaag gcttcgtaaa gaacttaaaa 
1801 aagaaactga tgctgcagag aaattacgga tagcaaagaa taatttagag atattaaatg 
18 61 agaagatgac agttcaacta gaagagactg gtaagagatt gcagtttgca gaaagcagag 
1921 gtccacagct tgaaggtgct gacagtaaga gctggaaatc cattgtggtt acaagaatgt 
1981 atgaaaccaa gttaaaagaa ttggaaactg atattgccaa aaaaaatcaa agcattactg 
2041 accttaaaca gcttgtaaaa gaagcaacag agagagaaca aaaagttaac aaatacaatg 
2101 aagaccttga acaacagatt aagattctta aacatgttcc tgaaggtgct gagacagagc 
2161 aaggccttaa acgggagctt caagttctta gattagctaa tcatcagctg gataaagaga 
2221 aagcagaatt aatccatcag atagaagcta acaaggacca aagtggagct gaaagcacca 



901 gtaaaaagtg gcaagccaaa atagaaggaa ttcgaaacaa gttaaaagag aaagaggggg 



1141 acttagaaaa tgatatattg tatatgaggg cccaccaagc tcttcctcga gattctgttg 
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2281 tacctgatgc tgatcaacta 



aaaaaaaaaa aaaaaaa 



// 



se2-2 



protein 



761aa 



1 meqtvaeqdd slssllvklk kvsqdlerqr eitelkvkef eniklqlqen hedevkkvka 
61 evedlkylld qsqkesqclk selqaqkean sraptttmrn lverlksqla lkekqqkals 
121 rallelraem taaaeeriis atsqkeahln vqqivdrhtr elktqvedln enllklkeal 
181 ktsknrensl tdnlndlnne lqkkqkaynk ilrekeeidq endelkrqik rltsglqgkp 
241 ltdnkqslie elqrkvkkle nqlegkveev dlkpmkekna keelirweeg kkwqakiegi 
301 rnklkekege vftltkqlnt lkdlfakadk ekltlqrklk ttgmtvdqvl giraleseke 
361 leelkkmld lendilymra hqalprdsvv edlhlqnryl qeklhalekq fskdtyskps 
4 21 isgiesddhc qreqelqken Iklsseniel kfqleqankd lprlknqvrd lkemceflkk 
481 ekaevqrklg hvrgsgrsgk tipelektig lmkkvvekvq reneqlkkas giltsekraan 
541 ieqeneklka eleklkahlg hqlsmhyesk tkgtekiiae nerlrkelkk etdaaeklri 
601 aknnleilne kmtvqleetg krlqfaesrg pqlegadsks wksiwtrmy etklkeletd 
661 iakknqsitd lkqlvkeate reqkvnkyne dleqqikilk hvpegaeteq glkrelqvir 
721 lanhqldkek aelihqiean kdqsgaesti pdadqlkkkk k 



// 



Fig. 8 (2) 
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sel4-3 



2620 bp 



BASE COUNT. 



776 a 



733 c 



659 g 



452 t 



ORIGIN 



1 atcaaatgct gctcgatccc 



accaacccca 



gcgccggcac 



tgccaagata 



gacaagcagg 



61 


agaaggtcaa 


gctcaacttt 


gacatgacgg 


catcccccaa 


gatcctgatg 


agcaagcctg 


121 


tgctgagtgg 


gggcacaggc 


cgccggattt 


ccttzgtcgga 


tatgccgcgc 


tcccccatga 


181 


gcacaaactc 


ttctgtgcac 


acgggctccg 


acgtggagca 


ggatgctgag 


aagaaggcca 


241 


cgtcgagcca 


cttcagtgcg 


agcgaggagt 


ccatggactt 


cctggataag 


agcacagctt 


301 


caccagcctc 


caccaagacg 


ggacaagcag 


ggagtttatc 


cggcagccca 


aagcccttct 


361 


ctcctcaact 


gtcagctcct 


atcacgacga 


aaacggacaa 


aacctccacc 


accggcagca 


421 


tcctgaatct 


taacctggat 


cgaagcaaag 


ctgagatgga 


tttgaaggag 


ctgagcgagt 


481 


cggtccagca 


acagtccacc 


cctgttcctc 


tcatctctcc 


caagcgccag 


attcgtagca 


541 


ggttccagct 


gaatcttgac 


aagaccatag 


agagttgcaa 


agcacaatta 


ggcataaatg 


601 


aaatctcgga 


agatgtctat 


acggccgtag 


agcacagcga 


ttcggaggat 


tctgagaagt 


661 


cagatagtag 


cgatagtgag 


tatatcagtg 


atgatgagca 


gaagtctaag 


aacgagccag 


721 


aagacacaga 


ggacaaagaa 


ggttgtcaga 


tggacaaaga 


gccatctgct 


gttaaaaaaa 


781 


agcccaagcc 


tacaaaccca 


gtggagatta 


aagaggagct 


gaaaagcacg 


tcaccagcca 


841 


gcgagaaggc 


agaccctgga 


gcagtcaagg 


acaaggccag 


ccctgagcct 


gagaaggact 


901 


tttccgaaaa 


ggcaaaacct 


tcacctcacc 


ccataaagga 


taaactgaag 


ggaaaagatg 


961 


agacggattc 


cccaacagtc 


catttgggcc 


tggactctga 


ttcagagagc 


gaacttgtca 


1021 


tagatttagg 


agaagaccat 


tctgggcggg 


agggtcgaaa 


aaataagaag 


gaacccaaag 


1081 


aaccatctcc 


caaacaggat 


gttgtaggta 


aaactccacc 


atccacgacg 


gtgggcagcc 


1141 


attctccccc 


ggaaacaccg 


gtgctcaccc 


gctcttccgc 


ccaaacttcc 


gcggctggcg 


1201 


ccacagccac 


caccagcacg 


tcctccacgg 


tcaccgtcac 


ggccccggc'c 


cccgccgcca 


1261 


caggaagccc 


agtgaaaaag 


cagaggccgc 


ttttaccgaa 


ggagactgcc 


ccggccgtgc 


1321 


agcgggtcgt 


gtggaactca 


tcaactgtcc 


agcagaagga 


gatcacacag 


agcccatcca 


1381 


cgtccaccat 


caccctggtg 


accagcacac 


agtcatcggc 


cctggtcacc 


agctcggggt 


1441 


ccatgagcac 


ccttgtgtcc 


tcagtcaacg 


ctgacctgcc 


catcgccact 


gcctcagctg 


1501 


atgtcgccgc 


tgatattgcc 


aagtacacta 


gcaaaatgat 


ggatgcaata 


aaaggaacaa 


1561 


tgacagaaat 


atacaacgat 


ctttctaaaa 


acactactgg 


aagcacaata 


gctgagattc 


1621 


gcaggctgag 


gatcgagata 


gagaagctcc 


agtggctgca 


ccagcaagag 


ctctccgaaa 


1681 


tgaaacacaa 


cttagagctg 


accatggcgg 


agatgcggca 


gagcctggag 


caggagcggg 


1741 


accggctcat 


cgccgaggtg 


aagaagcagc 


tggagttgga 


gaagcagcag 


gcggtggatg 


1801 


agaccaagaa 


gaagcagtgg 


tgcgccaact 


gcaagaagga 


ggccatcttt 


tactgctgtt 


1861 


ggaacactag 


ctactgtgac 


tacccctgcc 


agcaagccca 


ctggcctgag 


cacatgaagt 


1921 


cctgcaccca 


gtcagctact 


gctcctcagc 


aggaagcgga 


tgctgaggtg 


aacacagaaa 


1981 


cactaaataa 


gtcctcccag 


gggagctcct 


cgagcacaca 


atcagcacct 


tcagaaacgg 


2041 


ccagcgcctc 


caaagagaag 


gagacgtcag 


ctgagaaaag 


caaggagagt 


ggctcgaccc 


2101 


ttgacctttc 


tggctccaga 


gagacgccct 


cctccattct 


cttaggctcc 


aaccaaggct 


2161 


ctgaccattc ccggagtaat 


aaatccagtt 


ggagcagcag 


tgatgagaag 


aggggatcga 


2221 


cacgttccga 


tcacaacacc 


agtaccagca 


cgaagagcct 


cctcccgaaa 


gagtctcggc 
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2281 tggacacctt ctgggactag cagtgaatcg ggacacaaac cacccacccc attgggagaa 
2341 aaacccagac gccaggaaaa gaagaaacaa caaaggcagg agaacagcca ctttcagact 
24 01 tc^aaatgac aaaaccctca gttgagcctg agcccccggc gcgggggctg ctacactaca 
24 61 ggacacccag catcggcttt gactgcagac tgttcaccca cacgagccct gtgcttttgg 
2521 tgtaaataat gtacaatttg tggatgtcat tgaatctaga ggactttccc ctttttatat 
2581 ttgtattaac tttaacttat taaaaaaaaa aaaaaaaaaa 

// 

sel4-3 protein 764aa 

1 mlldptnpsa gtakidkqek vklnfdmtas pkilraskpvl sggtgrrisl sdmprspmst 
61 nssvhtgsdv" eqdaekkats shfsaseesm dfldkstasp astktgqags lsgspkpfsp 
121 qlsapittkt dktsttgsil nlnldrskae mdlkelsesv qqqstpvpli spkrqirsrf 
181 qlnldkties ckaqlginei sedvytaveh sdsedseksd ssdseyisdd eqkskneped 
241 tedkegcqmd kepsavkkkp kptnpveike elkstspase kadpgavkdk aspepekdfs 
301 ekakpsphpi kdklkgkdet dsptvhlgld sdseselvid lgedhsgreg rknkkepkep 
361 spkqdwgkt ppsttvgshs ppetpvltrs saqtsaagat attstsstvt vtapapaatg 
4 21 spvkkqrpll pketapavqr wwnsstvqq keitqspsts titlvtstqs salvtssgsm 
481 stlvssvnad lpiatasadv aadiakytsk mmdaikgtmt eiyndlsknt tgstiaeirr 
541 Irieieklqw lhqqelsemk hnleltmaem rqsleqerdr liaevkkqle lekqqavdet 
601 kkkqwcanck keaifyccwn tsycdypcqq ahwpehmksc tqsatapqqe adaevntetl 
661 nkssqgssss tqsapsetas agkeketsae kskesgstld lsgsretpss illgsnqgsd 
721 hsrsnkssws ssdekrgstr sdhntststk sllpkesrld tfwd 

// 



Fig. 9 (2) 
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se20-4 



2830 bp 



BASE COUNT ' 724 a 756 c 814 g 536 t 
ORIGIN 



1 
X 




yayyayoy l, t 


gg t_ uy cguga 


gtct cct cag 


ctctgcttac 


eggtgegact 


OX 


aycy g cag eg 


ia #T /t r*r 4- m 

dcyugycLdd 


aagcgaaggg 


gcgagtgcga 


gtcccctgag 


ctgtacgaac 


191 
JL £. X 


/"» rt 4~ « /— « rs 

guyy tcyccd 


l. y y ct. uL<y olu 


agangagggg 


cct ccggcca 


agacccgccg 


cctgagcagc 


1 Q1 

X O X 


tCCyay LCtC 


Cacaycycya 


cccgcccccg 


ccgccgccgc 


cgccgccgct 


cctccgactg 


Z *i ± 


ccycLgccLL. 




ycy cccyayy 


ctccaggagg 


aaaeggagge 


ggcacaggtg 


Jill 


ct ggccgat a 


tgaggggggt 


gggactgggc 


cccgcgctgc 


ccccgccgcc 


tccctatgtc 




attct cgagg 




ccgcgcat ac 


ttcacgctcg 


gtgctgagtg 


tcccggctgg 


421 


gattctacca 


tegagteggg 


gtatggggag 


gcgcccccgc 


ecaeggagag 


cctggaagca 


481 


ctccccactc 


ctgaggcctc 


gggggggagc 


ctggaaatcg 


attttcaggt 


tgtacagtcg 


541 


agcagttttg 


gtggagaggg 


ggccctagaa 


acctgtagcg 


cagtggggtg 


ggcgccccag 


601 


aggttagttg 


acccgaagag 


caaggaagag 


gegatcatea 


tagtggagga 


tgaggatgag 


661 


gatgagcggg 


agagtatgag 


gagcagcagg 


aggeggegge 


ggeggeggag 


gaggaagcag 


721 


aggaaggtga 


agagggaaag 


cagagagaga 


aatgecgaga 


ggatggagag 


catcctgcag 


781 


gcactggagg 


atattcagct 


ggatctggag 


gcagtgaaca 


tcaaggcagg 


caaagccttc 


841- 


ctgcgtctca 


agegcaagtt 


catccagatg 


cgaagaccct 


tcctggagcg 


cagagacctc 


901 


atcatccagc 


atatcccagg 


cttctgggtc 


aaagcattcc 


tcaaccaccc 


cagaatttca 


961 


attt'tgatca 


accgacgtga 


tgaagacatt 


ttccgctact 


tgaccaatct 


gcaggtacag 


1021 


gatctcagac 


atatctccat 


gggctacaaa 


atgaagctgt 


acttccagac 


taacccctac 


1081 


ttcacaaaca 


tggtgattgt 


caaggagttc 


cagcgcaacc 


gctcaggccg 


gctggtgtct 


1141 


cactcaaccc 


caatccgctg 


gcaccggggc 


caggaacccc 


aggcccgtcg 


teaegggaac 


1201 


caggatgcga 


gccacagctt 


tttcagctgg 


ttctcaaacc 


atagcctccc 


agaggctgac 


1261 


aggattgctg 


agattatcaa 


gaatgatctg 


tgggttaacc 


ctctacgcta 


ctacctgaga 


noon 

1321 


gaaaggggct 


ccaggataaa 


gagaaagaag 


caagaaatga 


agaaaegtaa 


aaccaggggc 


TOOT 

138 1 


agatgtgagg 


tggtgatcat 


ggaagacgee 


cctgactatt 


atgcagtgga 


agacattttc 


1 A A 1 

X4 4 X 


agcgagatct 


cagacattga 


tgagacaatt 


catgacatca 


agatctctga 


cttcatggag 


i cm 


accaccgact 


acttcgagac 


cact gacaat 


gagataactg 


acatcaatga 


gaacatctgc 


JLOO 1 


gacagcgaga 


at cctgacca 


caatgaggtc 


cccaacaacg 


agaccactga 


taacaacgag 


1 £9 1 


agt get gatg 


accacgaaac 


cact gacaac 


aatgagagtg 


cagatgacaa 


caacgagaat 


1 fift 1 


cc tgaagaca 


anaacaagaa 


cac cgatgac 


aacgaagaga 


accctaacaa 


caacgagaac 


17/41 


actt aeggea 


acaacttctt 


caaaggtggc 


tt'ctggggca 


gccatggcaa 


caaccaggac 


1801 


ageagegaca 


gtgacaatga 


agcagatgag 


gccagtgatg 


atgaagataa 


tgatggcaac 


1861 


gaaggtgaca 


atgagggcag 


tgatgatgat 


ggcaatgaag 


gtgacaatga 


aggcagegat 


1921 


gatgacgaca 


gagacattga 


gtactatgag 


aaagttattg 


aagactttga 


caaggatcag 


1981 


gctgactacg 


aggaegtgat 


agagatcatc 


tcagacgaat 


cagtggaaga 


agagggcatt 


2041 


gaggaaggca 


tccagcaaga 


tgaggacatc 


tatgaggaag 


gaaactatga 


ggaggaagga 


2101 


agtgaagatg 


tctgggaaga 


aggggaagat 


teggacgact 


ctgacctaga 


ggatgtgctt 


2161 


caggtcccaa 


acggttgggc 


caatcegggg 


aagaggggga 


aaaceggata 


agggttttcc 


2221 


ccttttgggg 


atcacctctc 


tgtatccccc 


acccactatc 


ccatttgccc 


tcctcctcag 
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2281 ctagggccac gcggccccac attgcacttc tggggggtga ccgacttcgt acacgggttt 
2341 aaagtttatt tttatggttt agtcattgca gagttcttat tttgggggga gggaaagggg 
2401 gctagtcccc ttcttttggc cctccgcccc cgcaggcttc tgtgtgctgc taactgtatt 
24 61 tattgtgatg ccttggtcag ggcccctcta cccacttctc ccagtcagtt gtggccccag 
2521 cccctctccc tgtgctgtgt ■ ggagtggaca ccctgacccc cgaagcgggg agggccgctg 
2581 tggccttcgt cacagccgcg cagtgcccat ggaggcgctg ctgccacctt cctctcccaa 
2641 gttctttctc catccctctc ctcttcccgc cgcgccgcta gcccgcctcg gtgtctatgc 
2701 aaggccgctt cgccattgcg gtattctttg cggtattctt gtccccgtcc cccagaaggc 
27 61 tcgcctctcc ccgtggaccc tgttaatccc aataaaattc tgagcaagtt caaaaaaaaa 
2821 aaaaaaaaaa 

// 

se20-4 protein 693aa 

1 mdrpdegppa ktrrlssses pqrdpppppp pppllrlplp ppqqrprlqe eteaaqvlad 
61 mrgvglgpal pppppyvile eggirayfti gaecpgwdst iesgygeapp pteslealpt 
121 peasggslei dfqwqsssf ggegaletcs avgwapqrlv dpkskeeaii ivedededer 
181 esitirssrrrr rrrrrkqrkv kresrernae rmesilqale diqldleavn ikagkaflrl 
241 krkfiqmrrp flerrdliiq hipgfwvkaf lnhprisili nrrdedifry ltnlqvqdlr 
301 hismgylcmkl yfqtnpyftn mvivkefqrn rsgrlvshst pirwhrgqep qarrhgnqda 
361 shsffswfsn hslpeadria eiikndlwvn plryylrerg srikrkkqem kkrktrgrce 
421 vvimedapdy yavedifsei sdidetihdi kisdfmettd yfettdneit dinenicdse 
4 81 npdhnevpnn ettdnnesad dhettdnnes addnnenped nnkntddnee npnnnentyg 
541 nnffkggfwg shgnnqdssd sdneadeasd dedndgnegd negsdddgne gdnegsdddd 
601 rdieyyekvi edfdkdqady edvieiisde sveeegieeg iqqdediyee gnyeeegsed 
661 vweegedsdd sdledvlqvp ngwanpgkrg ktg 

// 
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se20-7 2100 bp 

BASE COUNT 900 a 329 c 4 63 g 4 08 t 

ORIGIN 

1 agagaatcca gaaagtgatg gagagccagt agtggaagat ggaacttctg taaaaacact 
61 ggaaacactc cagcaaagag tgaagcgtca agagaaccta cttaagcgtt gtaaggaaac 
121 aattcagtca cataaggaac aatgtacact attaactagt gaaaaagaag ctctgcaaga 
181 acaactggat gaaagacttc aagaactaga aaagataaag gaccttcata tggccgagaa 
241 gactaaactt atcactcagt tgcgtgatgc aaagaactta attgaacagc ttgaacaaga 
301 taagggaatg gtaatcgcag agacaaaacg tcagatgcat gaaaccctgg aaatgaaaga 

3 61 agaagaaatt gctcaactcc gtagtcgcat caaacagatg actacccagg gagaggaatt 
421 acgggaacag aaagaaaagt ccgaaagagc tgcttttgag gaacttgaaa aagctttgag 

4 81 tacagcccaa aaaacagagg aagcacggag aaaactgaag gcagaaatgg atgaacaaat 
541 aaaaactatc gaaaaaacaa gtgaggagga acgcatcagt cttcaacagg aattaagtcg 
601 ggtgaaacag gaggttgttg atgtaatgaa aaaatcctca gaagaacaaa ttgctaagct 
661 acagaagctt catgaaaagg agctggccag aaaagagcag gaactgacca agaagcttca 
721 gacccgagaa agggaatttc aggaacaaat gaaagtagct cttgaaaaga gtcaatcaga 
781 atatttgaag atcagccaag aaaaagaaca gcaagaatct ttggccctag aagagttaga 
841 gttgcagaaa aaagcaatcc tcacagaaag tgaaaataaa cttcgggacc ttcagcaaga 
901 agcagagact tacagaacta gaattcttga attggaaagt tctttggaaa aaagcttaca 
961 agaaaacaaa aatcagtcaa aagatttggc tgttcatctg gaagctgaaa aaaataagca 

1021 caatatggag attacagtca tggttgaaaa acacaagaca gaattggaaa gccttaagca 
1081 tcagcaggat gccctttgga ctgaaaaact ccaagtctta aagcaacaat atcagactga 
1141 aatggaaaaa cttagggaaa agtgtgaaca agaaaaagaa acattgttga aagacaaaga 
1201 gattatcttc caggcccaca tagaagaaat gaatgaaaag actttagaaa agcttgatgt 
12 61 gaagcaaaca gaactagaat cattatcttc tgaactgtca gaagtattaa aagcccgtca 
1321 caaactagaa gaggaacttt ctgttctgaa agatcaaaca gataaaatga agcaggaatt 
1381 agaggccaag atggatgaac agaaaaatca tcaccagcag caagttgaca gtatcattaa 
1441 agaacacgag gtatctatcc agaggactga gaaggcatta aaagatcaaa ttaatcaact 
1501 tgagcttctc ttgaaggaaa gggacaagca tttgaaagag catcaggctc atgtagaaaa 
1561 tttagaggca gatattaaaa ggtctgaagg ggaactccag caggcatctg ctaagctgga 
1621 cgtttttcag tcttaccaga gtgccacaca tgagcagaca aaagcatatg aggaacagtt 
1681 ggcccaattg cagcagaagt tgttggattt ggaaacagaa agaattcttc ttaccaaaca 
1741 • ggttgctgaa gttgaagcac aaaagaaaga tgtttgtact gagttagatg ctcacaaaat 
1801 ccaggtgcag gacttaatgc agcaacttga aaaacaaaat agtgaaatgg agcaaaaagt 
18 61 aaaatcttta acccaagtct atgagtccaa acttgaagat ggtaacaaag aacaggaaca 
1921 gacaaagcaa atcttggtgg aaaaggaaaa tatgatttta caaatgagag aaggacagaa 
1981 gaaagaaatt gagatactca cacagaaatt gtcagccaag gaggacagta ttcatatttt 
2041 gaatgaggaa tatgaaacca aatttaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 

// 

Fig. 11 
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se20-7 protein 623aa 

1 maektklitq lrdaknlieq leqdkgmvia etkrqmhetl emkeeeiaql rsrikqmttq 
61 geelreqkek seraafeele kalstaqkte earrklkaem deqiktiekt seeerislqq 
. 121 elsrvkqevv dvmkksseeq iaklqklhek elarkeqelt kklqtreref qeqmkvalek 
181 sqseylkisq ekeqqeslal eelelqkkai ltesenklrd lqqeaetyrt rilelessle 
241 kslqenknqs kdlavhleae knkhnmeitv mvekhktele slkhqqdalw teklqvlkqq 
301 yqtemeklre kceqeketll kdkeiifqah ieemnektle kldvkqtele slsselsevi 
361 karhkleeel svlkdqtdkia kqeleakinde qknhhqqqvd siikehevsi qrtekalkdq 
421 inqlelllke rdkhlkehqa hvenleadik rsegelqqas akldvfqsyq satheqtkay 
481 eeqlaqlqqk lldleteril ltkqvaevea qkkdvcteld ahkiqvqdlm qqlekqnsem 
541 eqkvksltqv yeskledgnk eqeqtkqilv ekenmilqmr egqkkeieil tqklsakeds 
601 ihilneeyet kfkkkkkkkk kkk 

// 



Fig. 11 (2) 
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PCTYDE01/04229 



se20-9 



5629 bp 



BASE COUNT 



2030 a 



905 c 



1181 g 



1513 t 



ORIGIN 



1 cttaagtgca aggaactctg tgttgggagg aaaaatgtcc ttcttcaatt tccgtaagat 
61 cttcaagttg gggagcgaga agaagaagaa gcagtacgaa cacgtgaaga gggacctgaa 
121 ccccgaagac ttttgggaga ttataggaga actgggcgac ggagcctttg ggaaagtgta 
181 caaggcccag aataaagaga ccagtgtttt agctgctgca aaagtgattg acactaaatc 
241 tgaagaagaa cttgaagatt acatggtaga gattgacata ttagcatctt gtgatcaccc 
301 aaatatagtc aagcttctag atgccttcta ttatgagaac aatctttgga tcctcattga 
361 attttgtgca ggtggagcag tagatgctgt gatgcttgaa cttgagagac cattaactga 
421 gtcccaaata caagtagttt gcaagcagac tttagatgca ttgaactact tacatgataa 
4 81 taagatcatc cacagagatc tgaaggctgg caacattctc tttaccttag atggagatat 
541 caaattggcg gattttggag tatcagctaa aaacacgagg acaattcaaa gaagagattc 
601 ctttattggt acaccatatt ggatggctcc . tgaagtagtc atgtgtgaaa catctaagga 
661 cagaccctat gactacaaag ctgatgtttg gtccctgggt atcactttaa tagaaatggc 
721 tgagatagaa ccacctcatc atgaattaaa tccaatgcga gtgctgctaa aaatagcaaa 

7 81 atctgagcca cctacattag cacagccatc cagatggtct tcaaatttta aggactttct 

8 41 aaagaaatgc ttagaaaaga atgtggatgc caggtggact acatctcagc tgctgcagca 
901 tccctttgtt actgttgatt ccaacaaacc catccgagaa ttgattgcag aggcgaaggc 

9 61 tgaagtaaca gaagaagttg aagatggcaa agaggaagat gaagaggagg aaacagaaaa 
1021 ttctctgcca atacctgcaa gtaagcgtgc atcttctgac cttagtatcg ccagctctga 
1081 agaagataaa ctttcacaaa atgcttgtat tttggagtct gtctcagaaa aaacagaacg 
1141 tagtaactct gaagataaac tcaacagcaa aattcttaat gaaaaaccca ccactgatga 
1201 acctgaaaag gctgtggagg atattaatga acatattacc gatgctcagt tagaagcaat 
12 61 gactgaactc catgacagaa cagcagtaat caaggagaat gaaagagaga agaggcccaa 
1321 gcttgaaaat ctgcctgaca cagaagacca agaaactgtg gacattaatt cagtcagtga 
1381 aggaaaagag aataatataa tgataacctt agaaacaaat attgaacata atctaaaatc 
14 41 tgaggaagaa aaggatcagg aaaagcaaca gatgtttgaa aataagctta taaaatctga 
1501 agaaattaaa gatactattt tgcaaacagt agatttagtt tctcaagaga ctggagaaaa 
1561 agaggcaaat attcaggcag ttgatagtga agttgggctt acaaaggaag acacccaaga 
1621 gaaattgggg gaagacgaca aaactcaaaa agatgtgatc agcaatacaa gtgatgtgat 
1681 aggaacatgt gaggcagcag atgtggctca gaaagtggat gaagacagtg ctgaggatac 

17 41 gcagagtaat gatgggaaag aagtggtcga agtaggccag aaattaatta ataagcccat 
1801 ggtgggtcct gaggctggtg gtactaagga agttcctatt aaagaaatag ttgaaatgaa 

18 61 tgaaatagaa gaaggtaaaa ataaggaaca agcaataaac agttcagaga acataatgga 
1921 catcaatgag gaaccaggaa caactgaagg tgaagaaatc actgagtcaa gtagcactga 
1981 agaaatggag gtcagaagtg tggtggctga tactgaccaa aaggctttag gaagtgaagt 
2041 tcaggatgct tctaaagtca ctactcagat agataaagag aaaaaagaaa ttccagtgtc 
2101 aattaaaaaa gagcctgaag ttactgtagt ttcacagccc actgaacctc agcctgttct 
2161 aatacccagt attaatatca actctgacag tggagaaaat aaagaagaaa taggttcttt 
2221 atcaaaaact gaaactattc tgccaccaga atctgagaat ccaaaggaaa atgataatga 
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2281 ttcaggcact ggttccactg ctgatactag cagtattgac ttgaatttat ccatctctag- 
2341 ctttctaagt aaaactaaag acagtggatc gatatcttta caagaaacaa gaagacaaaa 
2401 gaaaacattg aagaaaacac gcaaatttat tgttgatggt gtagaagtga gtgtaacaac 
24 61 atcaaagata gttacagata gtgattccaa aactgaagaa ttgcggtttc ttagacgtca 
2521 ggaacttcgg gaattaagat ttcttcagaa agaagagcaa agagcccaac aacagctcaa 
2581 tagcaaacta cagcaacaac gagaacaaat tttccggcgc tttgagcagg aaatgatgag 
2641 taaaaagcga caatatgacc aggaaattga gaatctagaa aaacagcaga aacagactat 
2701 cgaacgcctg gaacaagagc acacaaatcg cttgcgagat gaagccaaac gcatcaaagg 
27 61 agaacaagag aaagagttgt ccaaatttca gaatatgctg aagaaccgaa agaaggaggt 
2821 tataaatgaa gtggagaaag cacccaaaga gctgagaaaa gagctcatga aacgcaggaa 
2881 agaggagctt gcacaaagcc agcatgctca ggaacaagag tttgttcaga aacaacagca 
2941 agaattagat ggctctctga aaaagatcat ccagcagcag aaggcagagt tagctaatat 
3001 tgagagagag tgcctgaata acaagcaaca gctcatgaga gctcgagaag ctgcaatttg 
3061 ggagctcgaa gaacgacact tacaagaaaa acaccagctg ctcaaacagc agcttaaaga 
3121 tcagtattt-c atgcaaagac atcagctact taagcgccac gagaaggaaa cagagcaaat 
3181 gcagcgttac aatcaaagac ttattgagga attgaaaaac agacagactc aagaaagagc 
3241 aagactgccc aagattcagc gcagtgaagc caagactcga atggccatgt ttaagaagag 
3301 tttgagaatt aactcaacag ccacaccaga tcaggaccgt gataaaatta aacagtttgc 
3361 tgcacaagaa gaaaagaggc agaaaaatga gagaatggct cagcatcaga aacatgagaa 
3421 tcaaatgcga gatcttcagt tgcagtgtga agccaatgtc cgcgaactgc atcagctgca 
3481 gaatgaaaaa tgccacttgt tggttgagca tgagactcag aaactgaagg agttagatga 
3541 ggaacatagc caagaattaa aggagtggag agagaaattg agacctagga aaaagacact 
3601 ggaagaagag tttgccagga aactacagga acaggaagta ttctttaaaa tgactgggga 
3661 gtctgaatgc cttaacccat caacacagag ccggatttcc aaattttatc ctattcccag 
3721 cttgcattcc accggatcat aacaaaggga agcattctgt gcgtgggttt ggctctttca 
3781 gtatgtcatt ctgttctcat cttctgccac agtctctcag atagctcatg aagacaatca 
3841 cctgcctcac cttctaggtg ttttcctttt ttgttttttt .tgttttgttt tgtttttaag 
3901 caaagatgaa gggaaaacga actaagacag acgctaggcc atgttggcaa agtagcatct 
3961 tggtgactaa ggtgactttg tatattcatc ttaaaaatta tgttctttag acactgctac 
4021 ctgaaaactg ttggagaaat aatgtttaaa gttatttaag aaaaactgtt acatcactaa 
4081 gtattaataa attcttctta cctgacgtaa cttctcaatg cctaaattct gtagttgaag 
4141 ctctgctgca gagagttggg ataattttct tttggtggat cagctctcat aaaaaagcta 
4201 tgatttgctc aaatatgctg ttgactcagt aaatgaatat atttttttct ttaaatagga 
4261 acaacctctt ttaaaagaga aaaattattt cagtgatttg tcaaaacgaa ttacctcttt 
4321 tggcatgagc taataattga gggtgctaat tttcttaaga tagtgcctaa aacactaaat 
4381 ttcagtcaag tcgtaagtag gattttcttt ttgatcaaca gggacaaaaa catctttaga 
4441 attaaaaaca tggttgtttt ggaatttttg cttctcttac cgtttgatag aaattttcat 
4501 cctaaaatac atgtacaaag tttggaaaga tgaaaaaaag aggtagcttt tagattgcaa 
4561 attggaaatg taaaactcat gaaatttaag caatataggt ttagctatct gtgtttattt 
4 621 tctaaaataa tacctgagct ggttaaatga tttctctcca tcttagctaa ttctgtttaa 
4 681 aactctgtca gaggcctgca ggctgtgagt tatatttata aatatatctt cagaaattaa 
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4741 


tcttaaaaga 


ggcattagtt 


cagaatactt 


ttttaaaagt 


ttaaattaaa 


tatttaggca 


4801 


cgtcagaaat 


tacttttcct 


tattttgaaa 


tgaggctact 


tatgtcttgg 


ttttattttg 


4861 


ttccatgttt 


aaatcattca 


ctttgatttg 


agtgggaaaa 


gcctgaagcc 


tttatcatgt 


4921 


ggttgctggt 


gtgtgtaatt 


attaatgaaa 


tgttcactcc 


tagtccctta 


tgaggcttag 


4981 


aatttcaacc 


acgtgtcagg 


tcagacagta 


ttataaactg 


tactttgctg 


tctgagacag 


5041 


cacatttgtg 


aatgatgctt 


gctgcctgcc 


attttcaacc 


tattctctct 


taagagtgct 


5101 


aggtaccaaa 


ttgtgaaagt 


ttgttttcag 


ttatattact 


tttgaggctg 


gtgaaaaatt 


5161 


taaatgtaac 


tttgtgggaa 


cactgattca 


tatttagaaa 


atgtaaatgt 


ctgtagcact 


5221 


ttcttgcagt 


taatttgaaa 


actttggatg 


ctgaaccttg 


tttgtcagtg 


atttagatga 


52 81 


tttaaaaatg 


catgtgtgat 


ttgaatttta 


taattgtttt 


gacaagcata 


atttacttgg 


5341 


acaacttcgt 


aggtagcctt 


aacttctggc 


caagtttgtt 


ttttatataa 


atatatatac 


5401 


atatatacat 


attatgtatg 


gttgtaaatt 


catacactta 


tcacatgaat 


gtgttactgt 


5461 


atacaaaact 


cttaatgctt 


tattctcaaa 


tgctgggttg 


aaaaatgttt 


tgaaagcctt 


5521 


ttaaaatata 


tatctttata 


aagtaatatt 


caggatgatg 


ataaaaattg 


tttatattgt 


5581 


tatgataaaa 


atgacagtat 


aatgttaaaa 


aaaaaaaaaa 


aaaaaaaaa 





1 


msf fnfrkif 


klgsekkkkq 


yehvkrdlnp 


edfweiigel 


gdgaf gkvyk 


aqnketsvla 


61 


aakvidtkse 


eeledymvei 


dilascdhpn 


ivklldaf yy 


ennlwilief 


caggavdavm 


121 


lelerpltes 


qiqvvckqtl 


dalnylhdnk 


iihrdlkagn 


ilftldgdik 


ladf gvsakn 


181 


trtiqrrdsf 


igtpywmape 


wmcetskdr 


pydykadvws 


lgitliemae 


iepphhelnp 


241 


mrvllkiaks 


epptlaqpsr 


wssnf kdflk 


kcleknvdar 


wttsqllqhp 


fvtvdsnkpi 


301 


reliaeakae 


vteevedgke 


edeeeetens 


lpipaskras 


sdlsiassee 


dklsqnacil 


361 


esvsekters 


nsedklnski 


lnekpttdep 


ekavedineh 


itdaqleamt 


elhdrtavik 


421 


enerekrpkl 


enlpdtedqe 


tvdinsvseg 


kennimitle 


tniehnlkse 


eekdqekqqm 


481 


f enkliksee 


ikdtilqtvd 


lvsqetgeke 


aniqavdsev 


gltkedtqek 


Igeddktqkd 


541 


visntsdvig 


tceaadvaqk 


vdedsaedtq 


sndgkevvev 


gqklinkpmv 


gpeaggtkev 


601 


pikeivemne 


ieegknke.qa 


inssenimdi 


neepgttege 


eitessstee 


mevrsvvadt 


661 


dqkalgsevq 


daskvttqid 


kekkeipvsi 


kkepevtws 


qptepqpvli 


psininsdsg 


721 


enkeeigsls 


ktetilppes 


enpkendnds 


gtgstadtss 


idlnlsissf 


lsktkdsgsi 


781 


slqetrrqkk 


tlkktrkfiv 


dgvevsvtts 


kivtdsdskt 


eelrf lrrqe 


lrelrf lqke 


841 


eqraqqqlns 


klqqqreqif 


rrf eqemmsk 


krqydqeien 


lekqqkqtie 


rleqehtnrl 


901 


rdeakrikge 


qekelskfqn 


mlknrkkevi 


nevekapkel 


rkelmkrrke 


elaqsqhaqe 


961 


qefvqkqqqe 


ldgslkkiiq 


qqkaelanie 


reclnnkqql 


mrareaaiwe 


leerhlqekh 


1021 


qllkqqlkdq 


yfmqrhqllk 


rheketeqmq 


rynqrlieel 


knrqtqerar 


lpkiqrseak 


1081 


trraamf kksl 


rinstatpdq 


drdkikqf aa 


qeekrqkner maqhqkhenq 


mrdlqlqcea 


1141 


nvrelhqlgn 


ekchllvehe 


tqklkeldee 


hsqelkewre 


klrprkktle 


eef arklqeq 


1201 


evf f kmtges 


eclnpstqsr 


iskfypipsl 


hstgs 







/ 



e20-9 protein 



1235aa 



/ 



Fig. 12 (3) 
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se33-l 



3962 bp 



BASE COUNT 



1455 a 



627 c 



-867 g 



1013 t 



ORIGIN 



1 


aattcggcac 


gaggatgagt 


atagggctgt 


ttcttgeagg 


gttctttcga 


aattattget 


61 


aggttgactt 


ttaactaaat 


ccaagtgatg 


ttatttgtaa 


tgtagtactt 


aaatgttttt 


121 


cttgttgttt 


tagccaaaac 


tggacaagcc 


aaggcatctg 


tagecaaagt 


aaacaaatct 


181 


acagggaaat 


cagcaagttc 


tgtaaaatct 


gtggtaacgg 


tagctgttaa 


aggtaataaa 


241 


gcttcaatca 


aaacagcaaa 


atctggtgga 


aagaagtctc 


tagaagecaa 


aaagactggg 


301 


aatgtcaaaa 


acaaagactc 


taacaaacct 


gtgactatac 


cagaaaactc 


tgaaataaag 


361 


accagtattg 


aagtcaaagc 


cactgaaaac 


tgtgctaaag 


aagctatttc 


tgatgetget 


421 


ttOQaqocca 


cagagaatga 


accacttaac 


aaggaaacag 


aagaaatgtg 


tgtgatgctt 


481 


gt ct ctaatt 


tgcctaataa 


aggatattct 


gtagaagaag 

ZZJ ZZJ ZZJ w 


tttatgactt 


agcaaaacca 


541 


tttaatacrtt 


taaaggatat 


cttgatttta 


tcatctcata 


aaaaggcata 


tatagaaata 


601 

U W -L 




ctgctgagtc 


tatggtaaaa 


ttttatacct 


gcttcccagt 


attgatggat 


661 


nnaaatraac 

\j c« a. u. v. o 


tctcaataag 


tatggctcct 


gaaagcatga 


atataaaaga 


tgaggaagct 


791 


-a a +- 1 - 1- ^ taa 
a LdL ILaLwa 


pet toot aaa 


agaaaatgac 


ccagaggcaa 


acatagatac 


aatttatgat 


7 ft 1 

/ O JL 




aiT'ttcrataa 

0 »— *w u i.y Q L OU 


tttaccggaa 


gatggacttc 


aatatcrtact 

** Z2 z3 w zS 


ttgt gttgga 


ft A 1 

O f* JL 




oaaaaatooa 

V4 G C_-l t—i W ^ y v-i 


tcaccatgta 


ttcataagta 


at agaaacaa 


ggcaattctt 




\_-ciy Lay a l u 


crtcctcraatc 


tgct cagtca 


atgtatagct 


ttctgaaaca 


aaatccacaa 






accatatott 


ga cc t get ca 


ttatctccaa 


agatagactt 


accagaggtg 

ZZJ Zy ~J 


JL U d- JL 




a tgacccaga 


attagaaaaa 


gaaagccctg 


gcttgaaaaa 


cagtccaatt 


JL VJ O -L 




acrcrtacaaac 


agcaactgat 


agt ccctctg 


ttaaacctaa 


tgagcttgaa 


1141 




ctcccagcat 


tcaaacagaa 


actttggtac 


agcaggaaga 


gccttgtgag 


1201 


rraaoraaacta 


aaaaagcaac 


atgtgattct 


gaetttgetg 


ttgaaacttt 


ggagcttgaa 


1261 


actcaaggag 


aqgaqqtcaa 

^ ZJ ZJ ZD ZJ 


agaagaaatt 


cctcttgtag 


catccgcttc 


agtcagtatt 


1321 


gaacaattca 


ctgaaaatgc 


cgaggagtgt 


gctttaaatc 


agcagatgtt 


taacagtgac 


1381 


ttqgaqaaga 


aaggggcaga 


aattattaac 


cctaaaacag 


cattgttacc 


atctgacagt 


1441 


gtgtttgcag 


aagaaaggaa 


cctcaaagga 


attctagaag 


aatctccatc 


tgaagcagaa 


1501 


gatttcattt 


ctggaattac 


acagactatg 


gtagaagctg 


tagctgaagt 


agaaaaaaat 


1561 


gaaactgttt 


cggaaatatt 


gccatcaact 


tgtattgtga 


cgttagtacc 


aggaattccc 


1621 


actggggatg 


agaaga'cagt 


ggacaaaaag 


aatatttctg 


aaaaaaaagg 


taacatggat 


1681 


gaaaaggagg 


agaaggaatt 


taatactaag 


gaaaccagaa 


tggatcttca 


aataggaaca 


1741 


gagaaggctg 


aaaagaatga 


aggtaggatg 


gatgeagaaa 


aggtggaaaa 


gatggcagca 


1 ROI 

JLO U JL 






aaacacttta 


ttcaaaacat 


acccaaataa 


aggagtgggt 

^ 3 J ZD w ^ 


1861 


caggctaata 


agcctgatga 


aactagtaaa 


actagtattc 


tggctgtatc 


agatgtatct 


1921 


agcagtaaac 


caagcatcaa 


ggctgttata 


gtctcttctc 


ctaaggcaaa 


agctacagtt 


1981 


tcaaaaactg 


aaaatcagaa 


aagttttcca 


aaatctgtgc 


ccagagatca 


aataaatget 


2041 


gaaaagaaac 


tttcagccaa 


ggaatttggt 


ctgettaaac 


ccacaagtgc 


caggtcaggc 


2101 


ttggcagaaa 


gcagcagtaa 


attcaaacct 


actcagagca 


gtcttaccag 


aggaggcagt 


2161 


ggaaggatct 


cagccctgca 


aggcaagctt 


tctaaactgg 


attacagaga 


tataacaaaa 


2221 


caatctcagg 


aaacagaggc 


tagaccttcc 


atcatgaaac 


gggatgacag 


caacaataag 



0238803A2 I > 



WO 02/38803 J± PCT7DE0 1/04229 

|P 26/44 

2281 actttggctg agcaaaacac taagaatcct aaaagcacta ctggtagaag ttccaaatct 

2341 aaagaggagc cattatttcc atttaatttg gatgaatttg ttactgtgga tgaggttata 

2401 gaagaagtga atccttctca ggccaagcag aatccactaa agggaaaaag gaaagaaact 

2461 ctcaaaaatg ttcctttctc tgaacttaac ttaaagaaga aaaaggggaa aacttccact 

2521 cctcgtggtg ttgagggaga actatctttt gtgacattgg atgagattgg ggaagaggaa 

2581 gatgcagctg cacatctagc acaagctcta gtcactgtgg atgaagtaat tgatgaagaa 

2641 gaactaaata tggaagaaat ggtaaaaaat tcaaattcac tttttacatt agatgaatta 

2701 attgaccaag atgattgcat ttcccacagt gaacctaaag atgttactgt tctgtcagtg 

27 61 gctgaagaac aagatctcct caaacaggaa cgcttggtaa ctgtggatga aattggagaa 

2821 gtggaagagc tacctttgaa tgagtcagca gacataactt ttgccacttt aaatactaaa 

2881 ggaaatgaag gagatatcgt aagggattcc attggcttca tttcttctca ggtgcccgaa 

2941 gacccttcta ctttagttac tgtagatgaa atacaagatg acagcagtga tttgcattta 

3001 gtgactttgg atgaagtaac tgaagaggat gaagactctc tggcggattt taacaacctt 

3061 aaagaagagc ttaattttgt tactgttgat gaagttggag aggaggaaga tggagataat 

3121 gatttaaaag ttgagttagc acaaagcaaa aatgaccatc ccacagataa aaaagggaat 

3181 agaaagaaga gagctgtgga cacaaaaaag acaaaacttg aatccttgtc ccaagtgggt 

3241 ccagtaaatg agaatgttat ggaagaagat ctaaaaacca tgattgaaag acacttaaca 

3301 gctaaaactc caaccaagag agttagaatt gggaaaactc tgccatcaga aaaagctgtt 

3361 gtgacagaac cagcaaaagg tgaagaggcc ttccagatga gtgaagttga tgaggaatct 

3421 ggattaaagg attcagaacc agagcgaaaa cgcaagaaga ctgaagactc ttcttcaggc 

3481 aaatcagtgg tgtctgatgt ccctgaggaa ttagactttc ttgtacctaa ggctggattc 

3541 ttctgtccaa tttgttccct cttctactca ggtgaaaaag caatgacaaa tcactgcaag 

3601 agtacacgtc ataagcaaaa tactgagaaa ttcatggcca agcaaagaaa ggaaaaggag 

3661 cagaatgagg ctgaagaaag aagctctagg tgattggggg aaaggaaaga attcactaga 

3721 aatttgttta gggtccagtt gatttgtgta tttttgttat catttaattt gtaattttcg 

3781 tttcagaagc aaatattcgt gttgtacaaa tttctgattg ccctaaatgt agagagactg 

3841 atggggaaag tatgatgggt ttgattttta tatcaaatca tcaggcatgg agaaatatct 

3901 tttagaagtg ttaaaataaa tgttcctact gtatatttaa aataaaaaaa aaaaaaaaaa 

3961 aa 

Fig.. 13 (2) 
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1 mcvmlvsnlp nkgysvee'vy dlakpfgglk dililsshkk ayieinrkaa esmvkfytcf 

61 pvlmdgnqls ismapesmni kdeeaifitl vkendpeani dtiydrfvhl dnlpedglqc 
121 vlcvglqfgk vdhhvfisnr nkailqldsp esaqsmysfl kqnpqnigdh mltcslspki 
181 dlpevqiehd pelekespgl knspidesev qtatdspsvk pneleeestp siqtetlvqq 
241 eepceeeaek atcdsdfave tleletqgee vkeeiplvas asvsieqfte naeecalnqq 
301 mfnsdlekkg aeiinpktal lpsdsvfaee rnlkgilees pseaedfisg itqtmveava 
361 eveknetvse ilpstcivtl vpgiptgdek tvdkknisek kgnmdekeek efntketrmd 
421 Iqigtekaek negrmdaekv ekmaamkekp aentlfkayp nkgvgqankp detsktsila 
481 vsdvssskps ikavivsspk akatvskten qksfpksvpr dqinaekkls akefgllkpt 
541 sarsglaess skfkptqssl trggsgrisa lqgklskldy rditkqsqet earpsimkrd 
601 dsnnktlaeq ntknpksttg rsskskeepl fpfnldefvt vdevieevnp sqakqnplkg 
661 krketlknvp fselnlkkkk gktstprgve gelsfvtlde igeeedaaah laqalvtvde 
7 21 videeelnme emvknsnslf tldelidqdd cishsepkdv tvlsvaeeqd llkqerlvtv 
781 deigeveelp Inesaditfa tlntkgnegd ivrdsigfis sqvpedpstl vtvdeiqdds 
841 sdlhlvtlde vteededsla dfnnlkeeln fvtvdevgee edgdndlkve laqskndhpt 
901 dkkgnrkkra vdtkktkles lsqvgpvnen vmeedlktmi erhltaktpt krvrigktlp 
961 sekavvtepa kgeeafqmse vdeesglkds eperkrkkte dsssgksvvs dvpeeldflv 
1021 pkagff epic slfysgekam tnhckstrhk qntekfmakq rkekeqneae erssr 

// 



i 

Fig. 13 (3) 
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se37-2 



2710 bp 



BASE COUNT 



930 a 



4 68 c 



584 g 



728 t 



ORIGIN 



1 


ggagatacaa 


gtttggaagc 


aatcttgggg 


tacttaccca 


caaggctggt 


ggagaccaga 


61 


tcaggagaac 


ctcagtctga 


cgacattgaa 


gctagccgaa 


tgaagcgagc 


agctgcaaag 


121 


catctaatag 


aacgctacta 


ccaccagtta 


actgagggct 


gtggaaatga 


agcctgcacg 


181 


aatgagtttt 


gtgcttcctg 


tccaactttt 


cttcgtatgg 


ataataatgc 


agcagctatt 


241 


aaagccctcg 


agctttataa 


gattaatgca 


aaactctgtg 


atcctcatcc 


ctccaagaaa 


301 


ggagcaagct 


cagcttacct 


tgagaactcg 


aaaggtgccc 


ccaacaactc 


ctgctctgag 


361 


ataaaaatga 


acaagaaagg 


cgctagaatt 


gattttaaag 


atgtgactta 


cttaacagaa 


421 


gagaaggtat 


atgaaattct 


tgaattatgt 


agagaaagag 


aggattattc 


ccctttaatc 


481 


cgtgttattg 


gaagagtttt 


ttctagtgct 


gaggcattgg 


tacagagctt 


ccggaaagtt 


541 


aaacaacaca 


ccaaggaaga 


actgaaatct 


cttcaagcaa 


aagatgaaga 


caaagatgaa 


601 


gatgaaaagg 


aaaaagctgc 


atgttctgct 


gctgctatgg 


aagaagactc 


agaagcatct 


661 


tcctcaagga 


taggtgatag 


ctcacaggga 


gacaacaatt 


tgcaaaaatt 


aggccctgat 


721 


gatgtgtctg 


tggatattga 


•tgccattaga 


agggtctaca 


ccagattgct 


ctctaatgaa 


781 


aaaattgaaa 


ctgcctttct 


caatgcactt 


gtatatttgt 


cacctaacgt 


ggaatgtgac 



901 


atggagaata 


gaaatctcca 


cagtcctgaa 


tatctggaaa 


tggctttgcc 


attattttgc 


961 


aaagcgatga 


gcaagctacc 


ccttgcagcc 


caaggaaaac 


tgatcagact 


gtggtctaaa 


1021 


tacaatgcag 


accagattcg 


gagaatgatg 


gagacatttc 


agcaacttat 


tacttataaa 


1081 


gtcataagca 


atgaatttaa 


cagtcgaaat 


ctagtgaatg 


atgatgatgc 


cattgttgct 


1141 


gcttcgaagt 


gcttgaaaat 


ggtttactat 


gcaaatgtag 


tgggagggga 


agtggacaca 


1201 


aatcacaatg 


aagaagatga 


tgaagagccc 


atccctgagt 


ccagcgagct 


gacacttcag 


1261 


gaacttttgg 


gagaagaaag 


aagaaacaag 


aaaggtcctc 


gagtggaccc 


cctggaaact 


1321 


gaacttggtg 


ttaaaaccct 


ggattgtcga 


aaaccactta 


tcccttttga 


agagtttatt 


1381 


aatgaaccac 


tgaatgaggt 


tctagaaatg 


gataaagatt 


atactttttt 


caaagtagaa 


1441 


acagagaaca 


aattctcttt 


tatgacatgt 


ccctttatat 


tgaatgctgt 


cacaaagaat 


1501 


ttgggattat 


attatgacaa 


tagaattcgc 


atgtacagtg 


aacgaagaat 


cactgttctc 


1561 


tacagcttag 


ttcaaggaca 


gcagttgaat 


ccatatttga 


gactcaaagt 


tagacgtgac 


1621 


catatcatag 


atgatgcact 


tgtccggcta 


gagatgatcg 


ctatggaaaa 


tcctgcagac 


1681 


ttgaagaagc 


agttgtatgt 


ggaatttgaa 


ggagaacaag 


gagttgatga 


gggaggtgtt 


1741 


tccaaagaat 


tttttcagct 


ggttgtggag 


gaaatcttca 


atccagatat 


tggtatgttc 


1801 


acatacgatg 


aatctacaaa 


attgttttgg 


tttaatccat 


cttcttttga 


aactgagggt 


1861 


cagtttactc tgattggcat 


agtactgggt 


ctggctattt 


acaataactg 


tatactggat 


1921 


gtacattttc 


ccatggttgt 


ctacaggaag 


ctaatgggga 


aaaaaggaac 


ttttcgtgac 


1981 


ttgggagact 


ctcacccagt 


tctatatcag 


agtttaaaag 


atttattgga 


gtatgaaggg 


2041 


aatgtggaag 


atgacatgat 


gatcactttc 


cagatatcac 


agacagatct 


ttttggtaac 


2101 


ccaatgatgt 


atgatctaaa 


ggaaaatggt 


gataaaattc 


caattacaaa 


tgaaaacagg 


2161 


aaggaatttg 


tcaatcttta 


ttctgactac 


attctcaata 


aatcagtaga 


aaaacagttc 


2221 


aaggcttttc 


ggagaggttt 


tcatatggtg 


accaatgaat 


ctcccttaaa 


gtacttattc 



841 ttgacgtatc acaatgtata ctctcgagat cctaattatc 



tgaatttgtt 



cattatcgta 



« 
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2281 agaccagaag aaattgaatt gcttatatgt ggaagccgga atctagattt ccaagcacta 

2341 gaagaaacta cagaatatga cggtggctat accagggact ctgttctgat tagggagttc 

2401 tgggaaatcg ttcattcatt tacagatgaa caga^aaagac tcttcttgca gtttacaacg 

24 61 ggcacagaca gagcacctgt gggaggacta ggaaaattaa agatgattat agccaaaaat 

2521 ggcccagaca cagaaaggtt acctacatct catacttgct ttaatgtgct tttacttccg 

2581 gaatactcaa gcaaagaaaa acttaaagag agattgttga aggccatcac gtatgccaaa 

2641 ggatttggca tgctgtaaaa caaaacaaaa caaaataaaa caaaaaaaaa aaaaaaaaaa 

2701 aaaaaaaaaa 

// 

se37-l protein 852aa 

1 mkraaakhli eryyhqlteg cgneactnef cascptflrm dnnaaaikal elykinaklc 

61 dphpskkgas saylenskga pnnscseikm nkkgaridfk dvtylteekv yeilelcrer 

121 edysplirvi grvfssaeal vqsfrkvkqh tkeelkslqa kdedkdedek ekaacsaaam 

181 eedseasssr igdssqgdnn Iqklgpddvs vdidairrvy trllsnekie taflnalvyl 

241 spnvecdlty hnvysrdpny lnlfiivmen rnlhspeyle malplfckam sklplaaqgk 

301 lirlwskyna dqirrmmetf qqlitykvis nefnsmlvn dddaivaask clkmvyyanv 

361 vggevdtnhn eeddeepipe sseltlqell geerrnkkgp rvdpletelg vktldcrkpl 

421 ipfeefinep lnevlemdkd ytffkveten kfsfmtcpfi Inavtknlgl yydnrirmys 

4 81 erritvlysl vqgqqlnpyl rlkvrrdhii ddalvrlemi amenpadlkk qlyvefegeq 

541 gvdeggvske ffqlvveeif npdigmftyd estklfwfnp ssfetegqft ligivlglai 

601 ynncildvhf pmwyrklmg kkgtfrdlgd shpvlyqslk dlleyegnve ddmmitfqis 

661 qtdlfgnpmm ydlkengdki pitnenrkef vnlysdyiln ksvefkqfkaf rrgfhmvtne 

721 splkylfrpe eiellicgsr nldfqaleet teydggytrd svlirefwei vhsftdeqkr 

7 81 lflqfttgtd rapvgglgkl kiaiiakngpd terlptshtc fnvlllpeys skeklkerll 

8 41 kaityakgfg ml 

// 



Fig. 14 (2) 
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se89-l 



34 62 bp 



'BASE COUNT 



1195 a 



580 c 



688 g 



999 t 



ORIGIN 

1 cagatgtatt aaaaatagct cagtttttac aattttcttt gattcagtgt cgaaaggaat 



1 91 

-L £, »L 


ttaagcgagg 


ttttggttca 


y y LQQuwUuu 


a of- 1 1- a t* i- a t- 

wy L LLClLLClw 


y u> v> >— d L- a ^ 


naff ra^naf 
y a L uoauyaL 


181 


tagatgataa 


aaaattctta 


tactcaortc 


* — - V_- CI u d CI L. CI Q 


atcrcatatt 


a a t a ct" t rr +• i~ 


241 


tgcatgccta 


tatttttcgg 


cctgaagt gt 


atcaattacc 


tatttgt aaa 


ttaaaaoaac 


301 


tatttgaaga aaatagaaaa 


cfc t eancacrt 


ttaatccart 


ttcaaattat 


oaaoCTtcaao 

y &it*yy «_pV*»uciy 


Jul 


aagaagaaat 


gaatggtaca 


Q O C3.CI LUQOQ (_ 


■h'trtnaaa^r'n 
c Lyy aaaouy 


n a a +• =s arlra 
u o. cx uoau ^ G. 


ay ay y Lyaay 


4 91 


ccattatatc 


tggaaagcaa 




+- +- /■*»+■ +- +■ rrrra 
a l i_ i_ tyya 




y ca. Lay ay ^.oa 


A Q 1 


aagaattgat taatttaatt 


/"■* O /~f "f" fr +~ ta tt fx ~** 

Ccig uy Ldgya 


dddaydy ty L 


/-r /t 4-* /*t /™f ^ y» 


LUdgdCdCdy 




aagatatgag 


aagcaaaact 


ytCLtyaoya 


gga age ctga 


yy a Lu LdCC u 


goicictciuai.ga 


DUX 


gaaagctcgc 


caaaaccagt 


aatitatcig 


aaaatt geca 


tctgLatgaa 


yayLcrccac 


bol 


agcctattgg 


ctcacttgga 


cat gat get g 


acttgaggcg 


gcagcagcag 


gatacctgta 


721 


actccggcat 


tgctgacatc 


cataggctgt 


ttaattggtTi 


atcagaaaca 


ctagcaaatg 


781 


cgcgccattc tgatgcatct 


ctgacagaca 


cagtcaacaa 


, agecttagga 


ttgagcactg 


8 41 


atgatgccta 


taaacraacta 


aggcaaaaac 


atgagtatga 


gttgaactct 


accccagata 


901 


agaaagacta 


tgagcagcct 


acttgtgcaa 


aagttgaaaa 


tgcacagt tt 


aagggtactc 


OCT 

961 




— i /"» +" ra fT 3 n t~ f 

aLLayaciy i— i— 


gat gcaacat 


ctaagtattc 


4- r-i 4- 4- i-r 4- —,4-4- 

tgttgcLatt 


tctaccagcg 


JL Uz 1 


aagtgggcac 


tgaccataag 


ctacaLttya 


aagaagatcc 




agegugaata 


lUol 


attttgaaga 


ttgcagtttg 


i_y tcccaytg 


■ 4— 4- » ^ *-% 4— 4~ r~r s» 

LtCCCatLya 


— ^ « — \ 4~ /~y r \ 4- 4— +- 

aCaLyyaut u 


Uy Ldy dCddC 


JL ± ft JL 


agtctaagtc 


aaataatgtt 


gdaydydCLy 


ddd UdCdLLy 


yaadL. Lya l_ L_ 


/— ■ y— • aa+-+- n#-»a 
i— v_-dcl U LaLdy 


1 9D1 


acacactaaa 


gggcaccact 


y ay y a cy auy 




1~r*a rrrri~ rrrrarr 
uuayy Ly y a,y 


yayuoy y i.y 


19 61 

JL Z. U _L 


tgccagcagc 


agaggcagag 


r*r*n r* c t rr r*a n 

\»~L^y v.'^mo Lay 


Lyay i — y aaov. 


pa era era nrr 

c* v^ol y d y a y y 


a carri" crtt* an 

cj v — ' ci y i_ y V— »_ a y 


1321 


gagagtacaa 


tctcttttct 


aggaagatag 


aacraoratttt 

ti O. ^4 U w w W w 


gaagcaaaag 


aatgtt teat 


1381 


atgtcagtag 


agtttccaca 


cctatctttt 


caacacaaaa 


gaagat gaaa 


cggctttccg 


1441 


agttcatata 


ttctaagact 


tccaaagctg 


gtgtgcagga 


gtttgtagat 


ggtttgcatg 


1501 


agaagctaaa 


tactattatt 


attaaagcat 


caaccaaaaQ 


taaaaattta 


ccaccagtca 


1561 


gtcctaacga 


ttctggtgct 


aagatagcat 


cgaat cctct 


ggaaaggcat 


gt cataccag 


1621 


tttcctcaag 


tgacttcaac 


aataaacatc 


tccttgagcc 


actgtgtagt 


gatcctttga 


1 DO 1 


aagataccaa 


ctctgatgag 


cagcatt cca 


^ 4" y^i /T f^r 4" 4~ 

cttcggctLi 


ct a. c t g ci ci gx_ cl 


gaaatyaacc 


1741 


agcctcaaca 


tgccacagag 


ttaatggtga 


cttctgatca 


tattgtacct 


ggtgatatgg 


1801 


cccgggaacc 


agtagaagaa 


acaacaaaat 


cccccagtga 


tgtaaacatt 


tctgctcagc 


1861 


cagctctttc 


aaattttata 


agecagttag 


aacctgaagt 


atttaatagt 


ttggttaaaa 


1921 


tcatgaaaga 


cgtccagaaa 


aatactgtga 


aattttatat 


tcatgaagaa 


gaagagagtg 


1981 


tgctctgtaa 


agaaataaag 


gaatatctta 


tcaaattagg 


caatacagaa 


tgtcatcctg 


2041 


aacagttttt 


ggaaagaaga 


tcaaaattag 


ataaactatt 


gattattatt 


caaaatgaag 


2101 


acattgcagg 


tttcattcac 


aagatacctg 


gcttggtgac 


tttaaagaag 


ctcccctgtg 


2161 


ttagttttgc 


tggtgttgat 


agcctggatg 


atgttaaaaa 


tcatacatac 


aatgaattat 


2221 


ttgtatctgg 


aggttttatc 


gtatctgatg 


aatcaattct 


aaacccagag 


gttgtcacag 



61 tcaaaaatat aagegecata aattttcatt ctgttgttga aaagtatgta agtgaatttt 
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2281 ttgagaacct taaaaatttt ttgacattcc ttgaggaact tagtactcca gaaggaaaat 
2341 ggcaatggaa agtccactgt aaatttcaga agaaactaaa ggaactaggc agattgaatg 
2401 ctaaagctct aagtctgttg acgcttctga atgtctatca gaagaaacat ctggttgaaa 
24 61 ttttgtcata ccacaattgt gattcacaaa ctcgaaatgc tccagaattg gattgcctta 
2521 tcagacttca ggctcagaac atacagcaac gacacgtagt ctttttaaca gagaagaaca 
2581 tcaagatgct ttccagttat acagataatg gaatagtggt tgcaactgct gaagacttca 
2641 tgcaaaactt taaaaatctt gtgggctatc acaattcaat cacagaagaa aaccttccac 
2701 agcttggtgc taatgagaat cttgagtcgc agtcagctct tttagaaaac gatgaaaagg 
2761 atgaagagga tatgtctctg gattcagggg atgaaatctc acatatagaa gtatgcagca 
2821 attttcattc agaaatatgg gagaaagaga ccaaaggatc acgtggaaca gatcaaaaaa 
2881 agaatactca aattgagttg caatcgtctc ctgatgtgca aaacagttta ttagaagata 
2941 agacttacct tgattctgaa gagagaactt ctattgatat agtatgctct gaaggagaga 
3001 acagcaattc aacagaacaa gattcatata gtaactttca ggtttatcat agtcaattaa 
3061 atatgtccca tcagtttagt cattttaatg ttctcactca tcagacattt ttggggacac 
3121 catatgccct ttcatcaagt cagtctcaag aaaatgagaa ttacttctta tctgcttata 
3181 ctgaaagctt ggatagagat aaatctccac ctcccttaag ttgggggaaa agtgattctt 
3241 ccaggccata ttcacaagag aaataactgt agtaactttt tttttaagag attgttgtgg 
3301 actttgttta ttaacaattt atatttcatt ctctaaacaa aaggttcttg ttctttctca 
3361 aatgtttttt cttttattta aatcatgatg gcctgtaaca gttgaagcat ctaaaaattg 
3421 aaataaatat atatttttaa cataaaaaaa aaaaaaaaaa aa 

89-1 protein 1035aa 

1 mfpydsrldd kkflysaprn kshidtclha yifrpevyql picklkelfe enrklqqfsp 
61 lsdyegqeee mngtkmkf gk rnnsrgeaii sgkqrsshsl dydkdrvk^l inliqcrkks 
121 vggdsdtedm rsktvlkrkl edlpenmrkl aktsnlsenc hlyeespqpi gslghdadlr 
181 rqqqdtcnsg iadihrlfnw lsetlanarh sdasltdtvn kalglstdda yeelrqkhey 
241 einstpdkkd yeqptcakve naqfkgtqsl llevdatsky svaistsevg tdhklhlked 
301 pnlisvnnfe dcslcpsvpi ehgfrrqqsk snnveeteih wklipitdtl kgtteddvlt 
361 gqveeqcvpa aeaeppavse ttertvlgey nlfsrkieei Ikqknvsyvs rvstpifstq 
421 ekmkrlsefi ysktskagvq efvdglhekl ntiiikasak ggnlppvspn dsgakiasnp 
4 81 lerhvipvss sdfnnkhlle plcsdplkdt nsdeqhstsa ltevemnqpq hatelmvtsd 
541 hivpgdmare pveettksps dvnisaqpal snfisqlepe vfnslvkimk dvqkntvkfy 
601 iheeeesvlc keikeylikl gntechpeqf lerrskldkl liiiqnedia gfihkipglv 
661 tlkklpcvsf agvdslddvk nhtynelfvs ggfivsdesi lnpevvtven lknfltflee 
721 Istpegkwqw kvhckfqkkl kelgrlnaka lslltllnvy qOckhlveils yhncdsqtrn 
781 apeldclirl qaqniqqrhv vflteknikm lssytdngiv vataedfmqn fknlvgyhns 
841 iteenlpqlg anenlesqsa llendekdee dmsldsgdei shievcsnfh seiweketkg 
901 srgtdqkknt qielqsspdv qnslledkty Idseertsid ivcsegensn steqdsysnf 
961 qvyhsqlnms hqfshfnvlt hqtflgtpya Isssqsqene nyflsaytes ldrdkspppl 
1021 swgksdssrp ysqek 



Fig. 15 (2) 
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L14-2 2171 bp 

BASE COUNT 936 a 327 c 458 g 450 t 

ORIGIN 



1 


aattcggcac 


gaggattctt 


gtgccaaaac 


agacataggc 


tcagaaaatt 


ctgaacaaat 


61 


agctaatttt 


cctagtggaa 


attttgctaa 


acatatttca 


aaaacaaatg 


aaacagaaca 


121 


gaaagtaaca 


caaatattgg 


tggaattaag 


gtcatctaca 


tttccagaat 


cagctaatga 


181 


aaagacttat 


tcagaaagcc 


cctatgatac 


agactgcacc 


aagaaattta 


tttcaaaaat 


241 


aaagagcgtt 


tcagcatcag 


aggatttgtt 


ggaagaaata 


gaatctgagc 


tcttatctac 


301 


ggagtttgca 


gaacatcaag 


taccaaatgg 


aatgaataag 


ggagaacatg 


cattagttct 


361 


gtttgaaaag 


tgtgtgcaag 


ataaatattt 


gcagcaggaa 


catatcataa 


aaaagttaat 


421 


taaagaaaat 


aagaagcatc 


aggagctctt 


cgtagacatt 


tgttcagaaa 


aagacaattt 


481 


aagagaagaa 


ctaaagaaaa 


gaacagaaac 


tgagaagcag 


catatgaaca 


caattaaaca 


541 


gttagaatca 


agaatagaag 


aacttaataa 


agaagttaaa 


gcttccagag 


ataaactaat 


601 


agctcaagac 


gttacagcta 


aaaatgcagt 


tcagcagtta 


cacaaagaga 


tggcccaacg 


661 


gatggaacag 


gccaacaaga 


aatgtgaaga 


ggcacgccaa 


gaaaaagaag 


caatggtaat 


721 


gaaatatgta 


agaggtgaga 


aggaatcttt 


agatcttcga 


aaggaaaaag 


agacacttga 


781 


gaaaaaactt 


agagatgcaa 


ataaggaact 


tgagaaaaac 


actaacaaaa 


ttaagcagct 


841 


ttctcaggag 


aaaggacggt 


tgcaccagct 


gtatgaaact 


aaggaaggcg 


aaacgactag 


901 


actcatcaga 


gaaatagaca 


aattaaagga 


agacattaac 


tctcacgtca 


tcaaagtaaa 


961 


gtgggcacaa 


aacaaattaa 


aagctgaaat 


ggattcacac 


aaggaaacca 


aagataaact 


1021 


caaagaaaca 


acaacaaaat 


taacacaagc 


aaaggaagaa 


gcagatcaga 


tacgaaaaaa 


1081 


ctgtcaggat 


atgataaaaa 


catatcagga 


gtcagaagaa 


attaaatcaa 


atgagcttga 


1141 


tgcaaagctt 


agagtcacaa 


aaggagaact 


tgaaaaacaa 


atgcaagaaa 


aatctgacca 


1201 


gctagagatg 


catcatgcca 


aaataaagga 


actagaagat 


ctgaagagaa 


catttaagga 


1261 


gggtatggat 


gagttaagaa 


cactgagaac 


aaaggtgaaa 


tgtctagaag 


atgaacgatt 


1321 


aagaacagaa 


gatgaattat 


caaaatataa 


ggaaattatt 


aatcgccaaa 


aagctgaaat 


1381 


tcagaattta 


ttggacaagg 


tgaaaactgc 


agatcagcta 


caggagcagc 


ttcaaagagg 


1441 


taagcaagaa 


attgaaaatt 


tgaaagaaga 


agtggaaagt 


cttaattctt 


tgattaatga 


1501 


cctacaaaaa 


gacatcgaag 


gcagtaggaa 


aagagaatct 


gagctgctgc 


tgtttacaga 


1561 


aaggctcact 


agtaagaatg 


cacagcttca 


gtctgaatcc 


aattctttgc 


agtcacaatt 


1621 


tgataaagtt 


tcctgtagtg 


aaagtcagtt 


acaaagccag 


tgtgaacaaa 


tgaaacagac 


1681 


aaatattaat 


ttggaaagta 


ggttgttgaa 


agaggaagaa 


ctgcgaaaag 


aggaagtcca 


1741 


aactctgcaa 


gctgaactcg 


cttgtagaca 


aacagaagtt 


aaagcattga 


gtacccaggt 


1801 


agaagaatta 


aaagatgagt 


tagtaactca 


gagacgtaaa 


catgcctcta 


gtatcaagga 


1861 


tctcaccaaa 


caacttcagc 


aagcacgaag 


aaaattagat 


caggttgaga 


gtggaagcta 


1921 


tgacaaagaa 


gtcagcagca 


tgggaagtcg 


ttctagttca 


tcagggtccc 


tgaatgctcg 


1981 


aagcagtgca 


gaagatcgat 


ctccagaaaa 


tactgggtcc 


tcagtagctg 


tggataactt 


2041 


tccacaagta 


gataaggcca 


tgttgattga 


gagaatagtt 


aggctgcaaa 


aagcacatgc 


2101 


ccggaaaaat 


gaaaagatag 


aatttatgga 


ggaccacatc 


aaacaactgg 


tggaaaaaaa 


2161 


aaaaaaaaaa 


a 











// 



Fig. 16 (1) 



023S803A2 I > 



WO 02/38803 




33/44 



PCT/DE01/04229 



L14-2 protein 



613aa 



1 mnkgehalvl fekcvqdkyl qqehiikkli kenkkhqelf vdicsekdnl reelkkrtet 
61 ekqhmntikq lesrieelnk evkasrdkli aqdvtaknav qqlhkemaqr meqankkcee 



121 arqekeamvm kyvrgekesl dlrkeketle kklrdankel ekntnkikql sqekgrlhql 
181 yetkegettr lireidklke dinshvikvk waqnklkaem dshketkdkl ketttkltqa 
241 keeadqirkn cqdmiktyqe seeiksneld aklrvtkgel ekqmqeksdq lemhhakike 
301 ledlkrtfke gmdelrtlrt kvkclederl rtedelskyk eiinrqkaei qnlldkvkta 
361 dqlqeqlqrg kqeienlkee veslnslind lqkdiegsrk reselllfte rltsknaqlq 
4 21 sesnslqsqf dkvscsesql qsqceqmkqt ninlesrllk eeelrkeevq tlqaelacrq 
481 tevkalstqv eelkdelvtq rrkhassikd Itkqlqqarr kldqvesgsy dkevssmgsr 
541 ssssgslnar ssaedrspen tgssvavdnf pqvdkamlie rivrlqkaha rknekiefme 
601 dhikqlvekk kkk 



// 



Fig. 16 (2) 
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Li5~7 3513 bp 

BASE COUNT 1234 a 723 c 8 67 g 68 9 t 

ORIGIN 

1 ctcgaaatta accctcacta aagggaacaa aagctggagc tccaccgcgg tggcggccgc 
61 tctagaacta gtggatcccc cgggctgcag gaattcggca cgaggtgatg ctgctgctgc 
121 tgctgctgct gccgccgccg cctctattgc tgatactcta gtggggctgg aagggtggtt 
181 cctattcgca ccatcgccaa ccagagacag agggaaaaaa aaaaccggca gccactgctg 
241 atgttgggtt cggaggctgc atccgactcg gtcacaagga aaatggattc agtttgcatc 
301 tctcpctcct ttaaacagct tctccgggtc tcagcatggg cttccagggc agcgattgag 
361 gagaccttac caaggagcac cacacagtag atgctgagac atcgtactcc aggataagaa 
421 acagtaacat ggcagcacct gcttgaaaga aattaaaaac caacagactc catttagaaa 
481 ggaacaatgt ccaagaaagg* gcgaaataag ggcgagaagc ccgaggcact cattgttgcc 
541 cttcaagctg ccaatgaaga cctcaggacc aagctcacag acattcagat agagctgcat 
' 601 caagagaagt ccaaggtatc aaagcttgaa agagagaaga ctcaagaagc gaagaggatt 
661 cgtgagctgg agcagcgcaa gcacacggtg ctggtgacag aactcaaagc caagctccat 
721 gaggagaaga tgaaggagct gcaggctgtg agggagaacc ttatcaagca gcacgagcag 
781 gaaatgtcaa ggacggtgaa ggtacgtgat ggagagatcc agaggctcaa gtctgctctc 
841 tgtgctctcc gcgacggcag cagtgacaaa gtaaggacag cgctcaccat tgaggcccgg 
901 gaggaggccc ggaaactgtt tgacacagag cgccttaagc tcttacagga aattgcggac 
961 ctgaaaacgg ccaagaagca ggtggacgag gctctgagca atatgatcca agcagataaa 
1021 atcaaggctg gggaccttcg gagtgagcat cagtcccacc aagaagccat ctcgaagatc 
1081 aagtgggagt cggagcggga tattcggagg ctgatggatg aaatcaaagc caaggacagg 
1141 atcatctttt ccctggaaaa ggaactggag acccagacag gctatgtaca gaaactccaa 
1201 cttcagaagg aggctttgga cgaacaactc tttctggtca aggaggctga gtgcaacatg 
1261 agcagcccaa aacgagaaat tccaggaagg gcaggtgatg gttccgaaca ctgcagcagt 
1321 cctgatttgc gaagaaatca aaagagaata gctgaattga atgccactat aagaaaatta 
1381 gaagacagga ataccttgct tggagatgaa cgaaatgaac tgttaaaacg tgtgcgggaa 
1441 accgaaaagc aatgtaaacc tctcctggaa aggaacaagt gcctcgccaa gagaaacgat 
1501 gaactgatgg tgtccttgca gcgcatggaa gaaaaactaa aagccgttac caaggaaaat 
1561 tcagaaatga gagaaaaaat aacatcccat ccacccctga agaaattaaa atctctgaat 
1621 gacctcgacc aagctaatga agaacaagaa acagagtttc taaaacttca ggtcattgag 
1681 caacagaaca ttattgatga gctcacaagg gaccgagaaa agctcatccg tagaagaaag 
1741 catagaagaa gttccaagcc aattaagagg cctgttttgg acccgtttat tggctatgat 
1801 gaggactcta tggattcaga gacatcatcc atggcctcat ttagaacaga cagaacacca 
1861 gctactcctg atgatgactt ggatgaaagt ttagcagctg aagaatctga actaagattt 
1921 cgacaattaa caaaagaata tcaggccctc caaagagcat atgccctcct acaggagcag 
1981 acgggaggca tcatcgacgc tgaacgagaa gccaaggctc aagaacagct ccaagcagag 
2041 gtgctaaggt ataaagccaa aattgaagac ctggaagcga ctctggctca . gaaagggcag 
2101 gattcacact gggtagaaga taaacaactt ttcattaaga gaaaccagga gcttttagaa 
2161 aagatagaaa aacaggaggc agaaaatcac cggttacaac aagaactaca ggacgccaga 
2221 gaccagaatg agctgctgga gtttcgaaac ctagagctag aagagagaga gagacgatcc 
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2281 


cctccattta 


atctccaaat 


tcacccattc 


tcagatggtg 


tgagtgctct 


acagatctac 


2341 


tgtatgaaag 


aaggtgttaa 


ggatgtgaac 


atccctgatc 


tcataaagca 


gcttgatatc 


2401 


ttgggtgata 


atgggaattt 


aagaaatgaa 


gaacaagtgg 


ccataattca 


ggccagcact 


2461 


gtgctgtccc 


tggcagagaa 


gtggatccag 


cagattgaag 


gagctgaggc 


tgccctacac 


2521 


cagaaaatga 


tggaattgga 


aagtgacatg 


gaacagttct 


gcaaaataaa 


aggctatctg 


2581 


gaggaagaac 


tagactacag 


aaaacaagct 


cttgaccaag 


catatatgag 


aatccaggaa 


2641 


ctagaagcta 


ctttgtacaa 


tgctctacag 


caagaaactg 


ttatcaagtt 


tggtgaatta 


2701 


ttaagtgaaa 


aacagcaaga 


ggagctgagg 


acggcagtag 


aaaagttacg 


gcggcaaatg 


2761 


ctgaggaaga 


gcagagagta 


tgactgtcag 


attcttcagg 


agagaatgga 


gctcttacag 


2821 


caagcccatc 


agagaattcg 


tgacttagaa 


gataaaacag 


acatccagaa 


aagacaaata 


2881 


aaagacttag 


aagaaaagag 


taaccgaaaa 


catggataag 


atcccaggaa 


gacaagtgct 


2941 


tctaaacctt 


caaagatggc 


aaaattgttt 


acaccagtga 


gagggagatc 


aaaagctaag 


3001 


aactaccctg 


tagccaggac 


tacaactgtg 


tattttaaag 


ccattattca 


aggtttctta 


3061 


cttgacagtt 


cctacacaac 


cctgttgaaa 


atctacaata 


tatgctgcat 


ttaatgaaac - 


3121- 


atgtatatgt 


caaatcagaa 


gagaagaact 


ataaacatat 


attgtgtaaa 


gaaaaagttc 


3181 


agcaatggaa 


ctagtttctg 


cagatcaagc 


aaagatgtgt 


cttgggcatg 


gaaccaaagt 


3241 


tacaatgaaa 


tattcaaccc 


ctgctgtgca 


ggggggtcat 


tttaatgtaa 


caccacaccc 


3301 


catggaaaca 


ctagtcctga 


taataaacat 


cattttaaaa 


gatcaaaaca 


aacaaacaaa 


3361 


aaaaacaagg 


gtgggtgggg 


agtgaagcac 


gaggaatacc 


tatgaagagc 


tatttacaat 


3421 


aaaatgtttc 


a+"f"'f'fraaa art 
d <_ l_ U y dad ay 


tcaaaaaaaa 


aaaaaaaaaa 


actcgagggg 


gggcccggta 


3481 


cccaattcgc 


cctatagtga 


gtcgtattac 


aat 






7 protein 810aa 










1 


mskkgmkge 


kpealivalq 


aanedlrtkl 


tdiqielhqe 


kskvsklere 


ktqeakrire , 


61 


leqrkhtvlv 


telkaklhee 


kmkelqavre 


nlikqheqem 


srtvkvrdge 


iqrlksalca 


121 


lrdgssdkvr 


taltiearee 


arklfdterl 


kllqeiadlk 


takkqvdeal 


snmiqadkik 


181 


agdlrsehqs 


hqeaiskikw 


eserdirrlm 


deikakdrii 


f slekeletq 


tgyvqklqlq 


241 


kealdeqlf 1 


vkeaecnmss 


pkreipgrag 


dgsehcsspd 


lrrnqkriae 


Inatirkled 


301 


rntllgdern 


ellkrvrete 


kqckpllern 


kclakrndel 


mvslqrmeek 


lkavtkense 


361 


mrekitshpp 


lkklkslndl 


dqaneeqete 


f lklqvieqq 


niideltrdr 


eklirrrkhr 


421 


rsskpikrpv 


ldpf igyded 


smdsetssma 


sf rtdrtpat 


pdddldesla 


aeeselrfrq 


481 


ltkeyqalqr 


ayallqeqtg 


giidaereak 


aqeqlqaevl 


rykakiedle 


atlaqkgqds 


541 


hwyedkqlf i 


krnqelleki 


ekqeaenhrl 


qqelqdardq 


nellef mle 


leererrspp 


601 


fnlqihpf sd 


gvsalqiycm 


kegvkdvnip 


dlikqldilg 


dngnlrneeq 


vaiiqastvl 


661 


slaekwiqqi 


egaeaalhqk 


rranelesdmeq 


f ckikgylee 


eldyrkqald 


qaymriqele 


721 


atlynalqqe 


tvikfgells 


ekqqeelrta 


veklrrqmlr 


ksreydcqil 


qermellqqa 


781 


hqrirdledk 


tdiqkrqikd 


leeksnrkhg 









// 

Fig. 17 (2) 



BNSDOCID: <WO 0238803A2 I > 



WO 02/38803 £k PCT/DEO 1/04229 

'^F 36/44 



Li9-1 14 65 'bp 

BASE COUNT 334 a 423 c 443 g 265 t 

ORIGIN 



1 


aattcggcac 


gaggcgcggg 


ccgctgtgag 


gcgcggcggc 


gagcgacggg 


cgcggggccg 


61 


cggagcagcg 


agcgagcgag 


cgagcgcgag 


gccggagccc 


cggccaggcc 


cggccgaccc 


121 


gccgagcccg 


cgatgcgccc 


cggggccgcc 


ccccggcgca 


gctgacgccc 


cgcggccccg 


181 


cgaagacccc" 


ggccggccgg 


tcccggagga 


agcggccgcc 


gccgccgccg 


cccagcccag 


241 


cgcccgcgcc 


gcccgggcac 


catggcgggg 


aaggcggccg 


ccccgggcac 


cgcggtgctg 


301 


ctggtcacgg 


ccaacgtggg 


ctcgctcttc 


gacgacccag 


aaaacctgca 


gaagaactgg 


361 


cttcgggaat 


tttaccaggt 


cgtgcacaca 


cacaggccgc 


acttcatggc 


cttgcactgt 


421 


caggagtttg 


gagggaagaa 


ctacgaggcc 


tccatgtccc 


acgtggacaa 


gttcgtcaaa 


481 


gaactattgt 


cgagtgatgc 


gatgaaagaa 


tataacaggg 


ctcgagtcta 


cctggatgaa 


541 


aactacaaat 


cccaggagca 


cttcacggca 


ctaggaagct 


tttattttct 


tcatgagtcc 


601 


ttaaaaaaca 


tctaccagtt 


tgactttaaa 


gctaagaagt 


atagaaaggt 


cgctggcaaa 


661 


gagatctact 


cggatacctt 


agagagcacg 


cccatgctgg 


agaaggagaa 


gtttccgcag 


721 


gactacttcc 


ccgagtgcaa 


atggtcaaga 


aaaggcttca 


tccggacgag 


gtggtgcatt 


781 


gcagactgtg 


cctttgactt 


ggtgaatatc 


catcttttcc 


atgatgcttc 


caatctggtc 


841 


gcctgggaaa 


caagcccttc 


cgtgtactcg 


ggaatccggc 


acaaggcact 


gggctacgtg 


901 


ctggacagaa 


tcattgatca 


gcgattcgag 


aaggtttcct 


actttgtatt 


tggtgatttc 


961 


aacttccggc 


tggattccaa 


gtccgtcgtg 


gagacgctct 


gcacaaaagc 


caccatgcag 


1021 


acggtccggg 


ccgccgacac 


caatgaagtg 


gtgaagctca 


tatttcgtga 


gtcggacaac 


1081 


gaccggaagg 


ttatgctcca 


gttagaaaag 


aaactcttcg 


actacttcaa 


ccaggaggtt 


1141 


ttccgagaca 


acaacggcac 


cgcgctcttg 


gagtttgaca 


aggagttgtc 


tgtctttaag 


1201 


gacagactgt 


atgaactgga 


catctcgttc 


cctcccagct 


acccgtacag 


tgaggacgcc 


1261 


cgccagggtg 


agcagtacat 


gaacacccgg 


tgcccagcct 


ggtgtgaccg 


catcctcatg 


1321 


tccccgtctg 


ccaaggagct 


ggtgctgcgg 


gtgagtgtgt 


gctgccccag 


ccctgggcac 


1381 


agagggatgt 


ggagcgctgg 


gtctggtctg 


gcccagccct 


ggtgacaggg 


ccccaggggt 


1441 


gggggaaaaa 


aaaaaaaaaa 


aaaaa 









// 

L.9-1 protein 387aa 

1 magkaaapgt avllvtanvg slfddpenlq knwlrefyqv vhthrphfma lhcqefggkn 
61 yeasmshvdk fvkellssda mkeynrarvy Idenyksqeh ■ ftalgsf yf 1 heslkniyqf 
121 dfkakkyrkv agkeiysdtl estpmlekek fpqdyfpeck wsrkgfirtr wciadcafdl 
181 vnihlfhdas nlvawetsps vysgirhkal gyvldriidq rfekvsyfvf gdfnfrldsk 
241 svvetlctka tmqtvraadt nevvklifre sdndrkvmlq lekklfdyfn qevfrdnngt . 
301 allefdkels vfkdrlyeld isfppsypys edarqgeqym ntrcpawcdr ilmspsakel 
361 vlrvsvccps pghrgmwsag sglaqpw 

n Fig. 18 
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Li9-4 1681bp 

BASE COUNT 545 a 304 c 327 g 505 t 

ORIGIN 

1 gagggttaga tcgagcaacc ctctaaaagc agtttagagt ggtaaaaaaa aaaaaaacac 
61 accaaacgct cgcagccaca aaagggatga aatttcttct ggacatcctc ctgcttctcc 
121 cgttactgat cgtctgctcc ctagagtcct tcgtgaagct ttttattcct aagaggagaa 
181 aatcagtcac cggcgaaatc gtgctgatta caggagctgg gcatggaatt gggagactga 
241 ctgcctatga atttgctaaa cttaaaagca agctggttct ctgggatata aataagcatg 
301 gactggagga aacagctgcc aaatgcaagg gactgggtgc caaggttcat acctttgtgg 
361 tagactgcag caaccgagaa gatatttaca gctctgcaaa gaaggtgaag gcagaaattg 
421 gagatgttag tattttagta aataatgctg gtgtagtcta tacatcagat ttgtttgcta - 
481 cacaagatcc tcagattgaa aagacttttg aagttaatgt acttgcacat ttctggacta 
541 caaaggcatt tcttcctgca atgacgaaga ataaccatgg ccatattgtc actgtggctt 
601 cggcagctgg acatgtttcg gtccccttct tactggctta ctgttcaagc aagtttgctg 
661 ctgttggatt tcataaaact ttgacagatg aactggctgc cttacaaata actggagtca 
' 721 aaacaacatg tctgtgtcct aatttcgtaa acactggctt catcaaaaat ccaagtacaa 
781 gtttgggacc cactctggaa cctgaggaag tggtaaacag gctgatgcat gggattctga 
841 ctgagcagaa gatgattttt attccatctt: ctatagcttt tttaacaaca ttggaaagga 
901 tccttcctga gcgtttcctg gcagttttaa aacgaaaaat cagtgttaag tttgatgcag 
96i ttattggata taaaatgaaa gcgcaataag cacctagttt tctgaaaact gatttaccag 
1021 gtttaggttg atgtcatcta atagtgccag aattttaatg tttgaacttc tgttttttct 
1081 aattatcccc atttcttcaa tatcattttt gaggctttgg cagtcttcat ttactaccac 
1141 ttgttcttta gccaaaagct gattacatat gatataaaca gagaaatacc tttagaggtg 
1201 actttaagga aaatgaagaa aaagaaccaa aatgacttta ttaaaataat -ttccaagatt 
1261 atttgtggct cacctgaagg ctttgcaaaa tttgtaccat aaccgtttat ttaacatata 
1321 tttttatttt tgattgcact taaattttgt ataatttgtg tttctttttc tgttctacat 
1381 aaaatcagaa acttcaagct ctctaaataa aatgaaggac tatatctagt ggtatttcac 
1441 aatgaatatc atgaactctc aatgggtagg tttcatccta cccattgcca ctctgtttcc 
1501 tgagagatac ctcacattcc aatgccaaac atttctgcac agggaagcta gaggtggata 
1561 cacgtgttgc aagtataaaa gcatcactgg gatttaagga gaattgagag aatgtaccca 
1621 caaatggcag caataataaa tggatcacac ttaaaaaaaa aaaaaaaaaa aaaaaaaaaa 
1681 a 

// 

Li9-4 protein 300aa 

1 mkflldilll lpllivcsle sfvklfipkr rksvtgeivl itgaghgigr- Itayefaklk 
61 sklvlwdink hgleetaakc kglgakvhtf vvdcsnredi yssakkvkae igdvsilvnn 
121 agwytsdlf atqdpqiekt fevnvlahfw ttkaflpamt knnhghivtv asaaghvsvp 
181 fllaycsskf aavgfhktlt delaalqitg vkttclcpnf vntgfiknps tslgptlepe 
241 ewnrlmhgi lteqkmifip ssiaf lttle^ rilperf lav Ikrkisvkfd avigykmkaq 
301 

// Fig. 19 
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Lii5-2 

BASE COUNT 341 a 350 c 362 g 315 t 

ORIGIN 

1 aattcggcac gaggggagcg cagcagccat ggcaagccgt ctcctgctca acaacggcgc 
61 caagatgccc atcctggggt tgggtacctg gaagtcccct ccagggcagg tgactgaggc 
121 cgtgaaggtg gccattgacg tcgggtaccg ccacatcgac tgtgcccatg tgtaccagaa 
181 tgagaatgag gtgggggtgg ccattcagga gaagctcagg gagcaggtgg tgaagcgtga 
241 ggagctcttc atcgtcagca agctgtggtg cacgtaccat gagaagggcc tggtgaaagg 
301 agcctgccag aagacactca gcgacctgaa gctggactac ctggacctct accttattca 
361 ctggccgact ggctttaagc ctgggaagga atttttccca ttggatgagt cgggcaatgt 
4 21 ggttcccagt gacaccaaca ttctggacac gtgggcggcc atggaagagc tggtggatga 
481 agggctggtg aaagctattg gcatctccaa cttcaaccat ctccaggtgg agatgatctt 
541 aaacaaacct ggcttgaagt ataagcctgc agttaaccag attgagtgcc acccatatct 
601 cactcaggag aagttaatcc agtactgcca gtccaaaggc atcgtggtga ccgcctacag 
661 ccccctcggc tctcctgaca ggccctgggc caagcccgag gacccttctc tcctggagga 
721 tcccaggatc aaggcgatcg cagccaagca caataaaact. acagcccagg tcctgatccg 
7 81 gttccccatg cagaggaact tggtggtgat ccccaagtct gtgacaccag aacgcattgc 
841 tgagaacttt aaggtctttg actttgaact gagcagccag gatatgacca ccttactcag 
901 ctacaacagg aactggaggg tctgtgcctt gttgagctgt acctcccaca aggattaccc 
961 cttccatgaa gagttttgaa gctgtggttg cctgctcgtc cccaagtgac ctatacctgt 
1021 gtttcttgcc tcattttttt ccttgcaaat gtagtatggc ctgtgtcact cagcagtggg 
1081 acagcaacct gtagagtggc cagcgagggc gtgtctagct tgatgttgga tctcaagagc 
1141 cctgtcagta gagtagaagt ctcttccagt ttgcttztgcc cttctttcta ccctgctggg 
1201 gaaagtacaa cctgaatacc cttttctgac caaagagaag caaaatcta'c caggtcaaaa 
1261 tagtgccact aacggttgag ttttgactgc ttggaactgg aatcctttca gcaagacttc 
1321 tctttgcctc aaataaaaag tgcttttgtg aaaaaaaaaa aaaaaaaa 

// 

Lii5-2 protein 316aa 

1 masrlllnng akmpilglgt wksppgqvte avkvaidvgy rhidcahvyq nenevgvaiq 
61 eklreqvvkr eelfivsklw ctyhekglvk gacqktlsdl kldyldlyli hwptgfkpgk 
121 effpldesgn vvpsdtnild twaameelvd eglvkaigis nfnhlqvemi Inkpglkykp 
181 avnqiechpy ltqekliqyc qskgivvtay splgspdrpw akpedpslle dprikaiaak 
241 hnkttaqvli rfpmqrnlvv ipksvtperi aenfkvfdfe lssqdmttll synrnwrvca 
301 llsctshkdy pfheef 

// 



Fig- 20 
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LiilO-6 

BASE COUNT . 431 a 308 c 364 g 391 t 

ORIGIN 



. 1 


aattcggcac 


qaqqqtqqaa 


atttgagacc 


agcaagtact 


atgtgact at 


cattgatgee 


61 


ccaggacaca 


gagactttat 


caaaaacatg 


attacaggga 


cat ct caggc 


t gactgtgct 


121 


gtcctgattg 


ttqctqctqq 


tqttgqtqaa 


tttgaagctg 


gtatctccaa 


qaat qqacaq 


181 


acccgagagc 


atgccctt ct 


ggctt acaca 


ctqqqtqtaa 


aacaactaat 


tqtcqqtatt 


241 


aacaaaatgg 


attccactga 


gccaccctac 


agecagaaga 


qatatqaqqa 


aattgttaag 


301 


gaagt cagca 


cttacattaa 


gaaaattggc 


tacaaccccg 


acacagtagc 


atttgtgcca 


361 


atttctggtt 


qaaataatcra 


caacatgetg 


qaqccaaqtq 


ctaacatgcc 


ttggttcaag 


421 


qgatqqaaacr 


tcacccgtaa 


qqatqqcaat 


qccaqtqqaa 


ccacgctgct 


tqaqqctctq 


481 


gactgcatcc 


taccaccaac 


tcgtccaact 


gacaagccct 


tqcqcctqcc 


t ct ccaggat 


541 


atctacaaaa 


ttggt ggtat 


tggt act gt t 


cct crtt crcrcc 


gacjtggagac 


tcfcrtcftt ct c 


601 


aaacccaort a 


tggtggtcac 


etttget cca 


gtcaacgtta 


caaeggaagt 


aaaat ctgtc 


661 


naaatrrrarc 

y CL C4 CL l_ y v^d \w- 


atoaacrcttt 


craotoaaact 


C 1 1 G f"! t CTfTCI o 
*— i- ' 1 — • \— y y y y 


acaafccftcrcrcf 

cl \— - c-i cl v- y v** y y 


cttcaatafp *- 

i— i— v_» n cl w y v» 


721 


aa^aaL^ i~y i— 


f*t*CTi~ r* a a cr era 

o L.vj l 0. c* y y c* 




y y \m^cx cl i»*y »— l— y 


r*t* acrt* fiacacr 

v_* l. y y L- y a. \_>ay 


\-» c*. a cl a ci \_ y o \_- 


7 Rl 


f^C* SX 2 S f" f*Y f"T 

d^t_cicti,yy 




p*^ ^ p»3 f » i* pt p* "H 
v_, uuql i_ yuL 


octy y Ly a l La 


+"pp+"na appa 
l. 1— uy dcivv^ci 


f'OP'^i nnppaa 
v_ . I— d. y y i L.dd 


O H. JL 


cL LaaLJCyCCy 




uy uauLyya t_ 


4— r~* f-% "i — % i j-y /-* 

Ly L^auauyy 


p*rpapai"t*np 
u Uwdudu tyu 


ct i- y octet y lll 




gctyayCLya 


ctyyoctctciycit- 


Ly aLuy ucy l. 


uL-Lyy L_ctclclcl 




4- f~r r-t /—» t~* 4- aaa 
Ly yUUL-Lddd 


-7 O JL 


■4— 4~ «■-» 4— +- — 1 4- 

t LCLuyaayi 




+- /t p r- .n i~ +~ rr+" +■ 
tyL-OaLLyLL 


rj 4* a 4- |-r r~l\~ \~ 
LjoLLaLyy L. L.O 


p4-rt/Tr»aaPiPP 

uy y Lday 


- r™» a +■ pt+* rr+" pft~ +■ 
L-a uy uy LLJLL 


1021 


gagagcttct 


cagactatcc 


acctttgggt 


cgctttgctg 


ttcgtgatat 


gagacagaca 


1081 


gttgcggtgg 


gtgtcatcaa 


agcagtggac 


aagaaggctg 


ctggagctgg 


caaggtcacc 


1141 


aagtctgccc 


agaaagctca 


gaaggctaaa 


tgaatattat 


ccctaatacc 


tgccacccca 


1201 


ctcttaatca 


gtggtggaag 


aaeggtctea 


gaactgtttg 


tttcaattgg 


ccatttaagt 


1261 


ttagtagtaa 


aagactggtt 


aatgataaca 


atgcatcgta 


aaaccttcag 


aaggaaagga 


1321 


gaatgttttg 


tggaccactt 


tggttttctt 


ttttgcgtgt 


ggcagtttta 


agttattagt 


1381 


ttttaaaatc 


agtacttttt 


aatggaaaca 


acttgaccaa 


aaatttgtca 


cagaattttg 


1441 


agacccatta 


aaaaagttaa 


atgagaaaaa 


aaaaaaaaaa 


aaaaaaaaaa 


aaaa 



// 

Liil0-6 protein 361aa 

1 mitgtsqadc avlivaagvg efeagiskng qtrehallay tlgvkqlivg vnkmdstepp 

61 ysqkryeeiv kevstyikki gynpdtvafv pisgwngdnm lepsanmpwf kgwkvtrkdg 
121 nasgttllea ldcilpptrp tdkplrlplq dvykiggigt vpvgrvetgv Ikpgmvvtfa 
181 pvnvttevks vemhhealse alpgdnvgfn vknvsvkdvr rgnvagdskn dppmeaagft 
241 aqviilnhpg qisagyapvl dchtahiack faelkekidr rsgkkledgp kflksgdaai 
301 vdmvpgkpmc vesfsdyppl grfavrdmrq tvavgvikav dkkaagagkv tksaqkaqka 
361 k 

// 

Fig. 21 
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BASE COUNT 



113 a 



84 c 



99 g 



94 t 



8 others 



ORIGIN 



1 ngthctbrty nchckaattc ggcacgaggc tgcggacata aatcttaaag ctagtaacat 
61 gttgttcttc taggaattcc attcagctac agatttaagg tttatcagta gtatttccag 
121 aaagatggtc cgacacagtg gctcacgttt ataatcccag cactttggga ggccgaggtg 
181 ggtgaattgc ttgagtccag gagttcaaga ccagcctggg caacatggca aaaccctgtc 
241 tttgcctgta gtacccccag ctatttgaga ggctgaggtg gaagaatcac ctgagcctgg 
301 ggaggtcagg gctgcagtgt gctgaaattg cacaactgca ctccagcctg ggcaatcaga 
361 gtgagaccct gtctttaaga aaaaaaaaaa aaaaaaaa 



// 



Fig- 22 
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Nukleotid-Sequenz von GBP-TA (die Splicing Variante GBP-TA sh0 rt hat eine Lticke von 
Nukleotid Nuiiuner 411 bis einschliefilich 5 1 8): 

1 GCACTGAGGT CACCCTCCAG GCTGTGGAAC CTTTGTTCTT TCACTCTTTG 

51 CAATAAATCT TGCTGCTGCT CACTCTTTGG GTCCACACTG CCTTTATGAG 

101 CTGTAACACT CACTGGGAAT GTCTGCAGCT TCACTCCTGA AGC CAGCGAG 

151 ACCACGAACC CACCAGGAGG AACAAACAAC TCCAGACGCG CAGCCTTAAG 

201 AGCTGTAACA CTCACCGCGA AGGTCTGCAG CTTCACTCCT GAGCCAGCCA 

251 GACCACGAAC CCACCAGAAG GAAGAAACTC CAAACACATC CGAACATCAG 

301 AAGGAGCAAA CTCCTGACAC GCCACCTTTA AGAACCGTGA CACTCAACGC 

351 TAGGGTCCGC GGCTTCATTC TTGAAGTCAG TGAGACCAAG AACCCACCAA 

401 TTCCGGACAC GCTAATTGTT GTAGATCATC ACTTCAAGGT GCCCATATCT 

451 TTCTAGTGGA AAAATTATTC TGGCCTCCGC TGCATACAAA TCAGGCAACC 

501 AGAATTCTAC ATATATAAGG CAAAGTAACA TCCTAGACAT GGCTTTAGAG 

551 ATCCACATGT CAGACCCCAT GTGCCTCATC GAGAACTTTA ATGAGCAGCT 

601 GAAGGTTAAT CAGGAAGCTT TGGAGATCCT GTCTGCCATT ACGCAACCTG 

651 TAGTTGTGGT AGCGATTGTG GGCCTCTATC GCACTGGCAA ATCCTACCTG 

701 ATGAACAAGC TGGCTGGGAA GAACAAGGGC TTCTCTGTTG CATCTACGGT 

751 GCAGTCTCAC ACCAAGGGAA TTTGGATATG GTGTGTGCCT CATCCCAACT 

801 GGCCAAATCA CACATTAGTT CTGCTTGACA CCGAGGGCCT GGGAGATGTA 

851 GAGAAGGCTG ACAACAAGAA TGATATCCAG ATCTTTGCAC TGGCACTCTT 

901 ACTGAGCAGC ACCTTTGTGT ACAATACTGT GAACAAAATT GATCAGGGTG 

951 CTATCGACCT ACTGCACAAT GTGACAGAAC TGACAGATCT GCTCAAGGCA 

1001 AGAAACTCAC CCGACCTTGA CAGGGTTGAA GATCCTGCTG ACTCTGCGAG 

1051 CTTCTTCCCA GACTTAGTGT GGACTCTGAG AGATTTCTGC TTAGGCCTGG 

1101 AAATAGATGG GCAACTTGTC ACACCAGATG AATACCTGGA GAATTCCCTA 

1151 AGGCCAAAGC AAGGTAGTGA TCAAAGAGTT CAAAATTTCA ATTTGCC CCG 

1201 TCTGTGTATA CAGAAGTTCT TTCCAAAAAA GAAATGCTTT ATCTTTGACT 

1251 TACCTGCTCA CCAAAAAAAG CTTGCCCAAC TTGAAACACT GCCTGATGAT 

1301 GAGCTAGAGC CTGAATTTGT GCAACAAGTG ACAGAATTCT GTTCCTACAT 

1351 CTTTAGCCAT TCTATGACCA AGACTCTTCC AGGTGGCATC ATGGTCAATC 
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(2) ZZ 

vaaHHMDiaN O^arixarEa xOasOaAcraa sirawaAaiva nasxHiricrn xse 

aOaxawdiOA xOowSOaAHv ivxOAWSNa nOvrcvTAVNa ioarcaossiv ioc 

naaxtat^di'i HsoNAwiosa ixxxwsHsai ASoaaxAOOA aadanaaadi xse 

xaiOvaraOH vdiaaiaosra xaaaxOiorra drtNaNOAHOa soO^dOTSNa xoz 

TAaadiAaOo aiaisioaoH nxMA^daas vsavdaaAHa nadSisnrarn: xsx 

anaiAtran aivoOaixwA XNAAaxssrn: mnvaiQicusi ^NcrraaAaoi xox 

OaXCPTTArLLH NdMNdHdADM IMIOXXHSOA XSVASaO^LNM OVTMNWrLXS^ xs 

dx^toaiya AAAdOxivsi iarrcaONA^rc OasiaNanow daswHiarrew x 



i 



YYYYYYOX XXDWYDXXX XJ.XVJ.XW.IV xo^z 

XXXDVWXW VXXXVDWDX WDVOOOXXO OVOVXOXOW VOVWDVOV TSZZ 

VDVDVOXV9X OVDXOXXXDX DYXXXXXXXD OXXXOVOOOX VXVWXDOXO XQZZ 

VWXDXOVXX XXOXOXVDDX V9XVDOWXV VXXQX0VD9V 9VDDD9DVDO XS3Z 

VDDXOOVOXO VDXOXXODOV VDVXWtfVDX OOWDOXXVD WOVDOVOXD XOZZ 

OVDVDOXOOO VDWDOVDOX V9V0WDW9 9VDSXWW3 VOWOOVOVD XSX Z 

QOXDOOXXW VTOVWOaOV XVDVD9XVW DV9VDXOWO WDOVDXVDD XOX 3 

XOVDVDVOOO VOVOQVDOXV OXWVOOVOO WOVDOOVW DXXVDOOODO XSO£ 

OXXDOWTOD OOWOXD0OV VWDXODW9 YDOWVDXOV XOOS 

VOWOWm WOODVOVOV DVOXDXDODV OOVOXDVOVO VXXVXWDOX XS6X 

VOXOVOXOXD XDYOOYTOOX OWVXXXVXV W9VD0X0XX OWDWOXOO X06X 

OYDYXYYSOY WOODXDDOV DOODXVXOVX DVWOODWQ XOW9W9VD XS8X 

WWOVDXXV OXXOXDXWX VDDODVOOVD ODWXOXXVX XXWDODVOO X08X 

WDXOVDDW OWOVXOXDD XOOXXXXXVX VDOWXXOVX XXOOQDXDQX XSZ.X 

XVXXVOODXO OXVOOWOOX DDWOODVW X9XXXVDV9X TOVOWWD XOZ.X 

OXVOVXDVXO XDYOYDOXXY VOVWOVDDX XXOYYYDDY9 VXOXVOOWD XS9I 

XXXOXDVWV VDXVDXXOXO WOXXVDDOO VOOOVDVOXO VOOVDOVDVD X09T 

3XDOYOOXD9 XOOVOOVDOX DODVWOOXV DDDOX00V09 XSYYYSKTDOE) XSSX 

OOXWtfDOVO OVDXVXDVOD DOXXVOODOV YYYDDXOYDD XDOYDXDYYD XOSX 

VOVDVDVDXO ODXXDDOOXD OXOVDOXWO VOVXVDOXXO DDXDXYODDO XSfrX 

XDVDDVDXVO OOXWOXOXV XODV9X0DXO 9XDDW9WV XDXODXDXVO XO^X 
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401 SSDYCSALLK DIFGPLEEAV KQGIYSKPGG HNIjFIQKTEE LKAKYYREPR 
451 KGIQAEEVLQ KYLKSKESVS HAILQTDQAL TETEKKKKEA QVKAEAEKAE 
501 AQRIiAAIQRQ NEQMMQERER LHQEQVRQME IAKQNWLAEQ QKMQEQQMQE 
551 QAAQLS TTFQ AQNRSULiSEIi QHAQRTVNND DPCVLL 

Fig. 23 (3) 
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